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Patentanspriiche 

1 . Isolierte Nukleinsauresequenzen, die fur Polypeptide mit Acyl-CoA:Lyso- 
phosphoHpid-Acyltransferaseaktivitat codieren, wobei die durch die Nuklein- 
sauresequenzen codierten Acyl-CoA:Lysophospholipid-Acyltransferasen spezi- 
fisch G| 6 -, C 18 - C20- Oder C^Fettsauren mit mindestens einer Doppelbindung im 
Fettsauremolekul umsetzen. 

2. Isolierte Nukleinsauresequenzen gemaB Anspruch 1 ausgewahlt aus der Grup- 
pe: 

a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ 
ID NO: 5 Oder SEQ ID NO: 7 dargestellten Sequenz, 

b) Nukleinsauresequenzen, die sich als Ergebnis des degenerierten geneti- 
schen Codes von der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 Oder 
SEQ ID NO: 7 enthaltenden codierenden Sequenz ableiten lassen 

c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 Oder SEQ ID 
NO: 7 dargestellten Nukleinsauresequenz, die fur Polypeptide mit der in 
SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 8 darge- 
stellten Aminosauresequenz codieren und mindestens 40 % Homoiogie auf 
Aminosaureebene mit SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 oder 
SEQ ID NO: 8 aufweisen und eine Acyl-CoA:Lysophospholipid- 
Acyltransferaseaktivitat aufweisen. 

3. Isolierte Nukleinsauresequenz nach Anspruch 1 oder 2, wobei die Sequenz aus 
einem Eukaryont stammt. 

4. Aminosauresequenz, die von einer isolierten Nukleinsauresequenz nach einem 
der Anspriiche 1 bis 3 codiert wird. 

5. Genkonstrukt, enthaltend eine isolierte Nukleinsaure nach einem der Anspruche 
1 bis 3, wobei die Nukleinsaure funktionsfahig mit einem oder mehreren Regula- 
tionssignalen verbunden ist 

6. Genkonstrukt nach Anspruch 5, dadurch gekennzeichnet, dass das Nukleinsau- 
rekonstrukt zusatzliche Biosynthesegene des Fettsaure- oder Lipidstoffwechsels 
enthalt ausgewahlt aus der Gruppe Acyl-CoA-Dehydrogenase(n), AcyI-ACP[= 
acyl carrier protein]-Desaturase(n) f Acyl-ACP-Thioesterase(n), Fettsaure-Acyl- 
Transferase(n), Fettsaure-Synthase(n), Fettsaure-Hydroxylase(n), Acetyl- 
Coenzym A-Carboxylase(n), Acyl-Coenzym A-Oxidase(n), Fettsaure- 
Desaturase(n), Fettsaure-Acetylenasen, Lipoxygenases Triacylglycerol- 
Lipasen, Allenoxid-Synthasen, Hydroperoxid-Lyasen oder Fettsaure- 
Elongase(n). 
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7. Genkonstrukt nach Anspruch 5 oder 6, datfurch gekennzeichnet, dass das Nuk- 
leinsaurekonstrukt zusatzliche Biosynthesegene des Fettsaure- oder Lipidstoff- 
wechsels enthalt ausgewahlt aus der Gaippe der A-4-Desaturase-, A-5- 
Desaturase-, A-6-Desaturase-, A-8-Desatuase-, A-9-Desaturase-, A-12- 
Desaturase-, A-5-Elongase-, A-6-Elongase- oder A-9-EIongase. 

8. Vektor, enthaltend eine Nukleinsaure nach den Anspruchen 1 bis 3 oder ein 
Genkonstrukt nach den Anspruchen 5 bis 7. 

9. Transgener nicht-humaner Organismus, enthaltend mindestens eine Nukleinsau- 
re nach den Anspruchen 1 bis 3, ein Genkonstrukt nach den Anspruchen 5 bis 7 
oder einen Vektor nach Anspruch 8. 

10. Transgener nicht-humaner Organismus nach Anspruch 9, wobei der Organismus 
ein Mikroorganismus, ein nicht-humanes Tier oder eine Pflanze ist 

1 1 . Transgener nicht-humaner Organismus nach Anspruch 9 oder 10, wobei der 
Organismus eine Pflanze ist. 

12. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren in einem Organis- 
mus, dadurch gekennzeichnet, dass das Verfahren folgende Schritte umfasst: 

a) Einbringen mindestens einer Nukleinsauresequenz in den Organismus mit 
der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 
dargestellten Sequenz, die fur ein Polypeptid mit einer Acyl- 
CoA:Lysophospholipid-Acyltransferaseaktivitat codiert; oder 

b) Einbringen mindestens einer Nukleinsauresequenz in den Organismus, die 
sich als Ergebnis des degenerierten genetischen Codes von der in SEQ ID 
NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 enthaltenden co- 
dierenden Sequenz ableiten lasst, oder 

c) Einbringen mindestens eines Derivates der in SEQ ID NO: 1, SEQ ID NO: 

3, SEQ ID NO: 5 oder SEQ ID NO: 7 dargestellten Nukleinsauresequenz in 
den Organismus, die fur Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 

4, SEQ ID NO: 6 oder SEQ ID NO: 8 dargestellten Aminosauresequenz 
codieren und mindestens 40 % Homologie auf Aminosaureebene mit SEQ 
ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 8 aufweisen und 
eine aquivalente Acyl-CoA:Lysophospholipid-Acyltransferaseaktivitat auf- 
weisen, und 

d) kultivieren und emten des Organismus. 

13. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach Anspruch 12, 
dadurch gekennzeichnet, dass zusatzlich zu den unter (a) bis (c) genannten 
Nukleinsauresequenzen weitere Nukleinsauresequenzen in den Organismus 
eingebracht wurden, die fur Polypeptide des Fettsaure- oder Lipidstoffwechsels 
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ausgewahlt aus der Gruppe Acyl-CoA-Dehydrogenase(n), Acyl-ACP[= acyl car- 
rier protein]-Desaturase(n), Acyl-ACP-Thioesterase(n), Fettsaure-Acyl- 
Transferase(n), Fettsaure-Synthase(n), Fettsaure-Hydroxylase(n), Acetyl- 
Coenzym A-Carboxylase(n), Acyl-Coenzym A-Oxidase(n), Fettsaure- 
Desaturase(n), Fettsaure-Acetylenasen, Lipoxygenases Triacylglycerol- 
Upasen, Allenoxid-Synthasen, Hydroperoxid-Lyasen Oder Fettsaure- 
Elongase(n) codieren. 

14. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach Anspruch 12 
Oder 13, dadurch gekennzeichnet, dass zusatziich zu den unter (a) bis (c) ge- 
nannten Nukleinsauresequenzen weitere Nukleinsauresequenzen in den Orga- 
nismus eingebracht wurden, die fur Polypeptide ausgewahlt aus der Gruppe A-4- 
Desaturase-, A-5-Desaturase-, A-6-Desaturase-, A-8-Desatuase-, A-9- 
Desaturase-, A-12-Desaturase-, A-5-EIongase-, A-6-Elongase- Oder A-9- 
Elongaseaktivitat codieren. 

15. Verfahren zur Herstellung mehrfach urigesattigter Fettsauren nach den Anspru- 
chen 12 bis 14, dadurch gekennzeichnet, dass als Substrat der Acyl-CoAiLyso- 
phospholipid-Acyltransferasen C 16 -, C 18 -, C20- Oder C^Fettsauren verwendet 
werden. 

16. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den Anspru- 
chen 12 bis 15, dadurch gekennzeichnet, dass die mehrfach ungesattigten Fett- 
sauren aus dem Organismus in Form eines 6ls, Lipids Oder einerfreien Fettsau- 
re isoliert werden. 

17. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den Anspru- 
chen 12 bis 16, dadurch gekennzeichnet, dass die im Verfahren hergestellte 
mehrfach ungesattigten Fettsaure eine Ci 8 -, C20- Oder C^-Fettsauren mit min- 
destens zwei Doppelbindungen im Molekul ist. 

18. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den Anspru- 
chen 12 bis 17, dadurch gekennzeichnet, dass im Verfahren eine mehrfach un- 
gesattigte Fettsaure ausgewahlt aus der Gruppe Dihomo-Y-Iinolensaure, Arachi- 
donsaure, Eisosapentaensaure, Docosapentaensaure und Docosahexaensaure 
hergestellten wird. 

19. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den Anspru- 
chen 12 bis 18, dadurch gekennzeichnet, dass der Organismus ein Mikroorga- 
nismus, ein nicht-humanes Tier Oder eine Pflanze ist. 

20. Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den Ansprii- 
chen 12 bis 19, dadurch gekennzeichnet, dass der Organismus eine transgene 
Pflanze ist. 
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21 . Verfahren zur Herstellung mehrfach ungesattigter Fettsauren nach den Anspru- 
chen 12 bis 20, dadurch gekennzeichnet, dass die transgene Pflanze eine 6l- 
fruchtpflanze 1st 

22. 01, Upide oder Fettsauren Oder eine Fraktion davon, hergestelit durch das Ver- 
fahren nach einem der Anspruche 12 bis 21 . 

23. Oh Lipid- oder Fettsaurezusammensetzung, die mehrfach ungesattigter Fettsau- 
ren hergestelit nach einem Verfahren nach einem der Anspruche 12 bis 21 um- 
fasst und von transgenen Pflanzen stammt. 

24. Verwendung von 6l, Lipide oder Fettsauren hergestelit nach einem Verfahren 
nach einem der Anspruche 12 bis 21 oder OI-, Lipid- oder Fettsaurezusammen- 
setzung gemafi Anspruch 23 in Futter, Nahrungsmitteln, Kosmetika oder Phar- 
mazeutika. 
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Verfahren zur Herstellung mehrfach ungesattigter Fettsauren 
Beschreibung 

Die vorliegende Erfindung betrifft ein Verfahren zur Herstellung von mehrfach ungesat- 
tigten Fettsauren in einem Organismus indem Nukleinsauren in den Organismus ein- 
gebracht werden, die fur Polypeptide mit Acyl-CoALysophospholipid-Acyltrans- 
feraseaktivitat codieren. Vorteilhaftkonnen diese Nukleinsauresequenzen gegebenen- 
falls zusammen mit weiteren Nukleinsauresequenzen, die fur Polypeptide der Biosyn- 
these des Fettsaure- oder Lipidstoffwechels codieren, in dem transgenen Organismus 
exprimiert werden. 

Die Erfindung betrifft weiterhin die Nukleinsauresequenzen, Nukleinsaurekonstrukte 
enthaltend die erfindungsgemaBen Nukleinsauresequenzen, Vektoren enthaltend die 
Nukleinsauresequenzen und/oder die Nukleinsaurekonstrukte sowie transgene Orga- 
nismen enthalten die vorgenannten Nukleinsauresequenzen, Nukleinsaurekonstrukte 
und/oder Vektoren. 

Ein weitererTeil der Erfindung betrifft Ole, Lipide und/oder Fettsauren hergestellt nach 
dem erfindungsgemSBen Verfahren und deren Verwendung. 

Fettsauren und Triglyceride haben eine Vielzahl von Anwendungen in der Lebensmit- 
telindustrie, derTieremahrung, der Kosmetik und im Pharmabereich. Je nachdem ob 
es sich urn freie gesatBgte Oder ungesattigte Fettsauren oder urn Triglyceride mit ei- 
nem erhohten Gehalt an gesattigten oder ungesatHgten Fettsauren handelt, sind sie fur 
die unterschiedlichsten Anwendungen geeignet, so werclen beispielsweise mehrfach 
ungesattigte Fettsauren Babynahrung zur Erhdhung des Nahrwertes zugesetzt.. Mehr- 
fach ungesattigte o)-3-Fettsauren und w-6-Fettsauren stellen dabei einen wichtigen 
Bestandteil der tierischen und menschlichen Nahrung dar. Aufgrund der heute Qblichen 
Zusammensetzung der menschlichen Nahrung ist ein Zusatz von mehrfach ungesattig- 
ten w-3-Fettsauren, die bevorzugt in FischSlen vorkommen, zur Nahrung besondere 
wichtig. So werden beispielsweise mehrfach ungesattigte Fettsauren wie Docosahe- 
xaensaure (= DHA, C22:6 A4 - 7 - 1013 - 16 ' 19 ) oder Eisosapentaensaure (= EPA 
C20:5 A5A11 - 14 - 17 ) Babynahrung zur Erhohung des Nahrwertes zugesetzt. Der ungesat- 
tigten Fettsaure DHA wird dabei ein positiver Effekt auf die Entwicklung des Gehirns 
zugeschrieben. 

Im folgenden werden mehrfach ungesattigte Fettsauren als PUFA, PUFAs, LCPUFA 
oder LCPUFAs bezeichnet (poly unsaturated fatty acids, PUFA . long chain ooiy unsa- 
turated fatty acids, LCPUFA). 

Hauptsachlich werden die verschiedenen Fettsauren und Triglyceride aus Mikroorga- 
nismen wie Mortierella oder Schizochytrium oder aus Ol-produzierenden Pflanzen wie 
Soja, Raps, Algen wie Crypthecodinium oder Phaeodactylum und weiteren gewonnen, 
wobei sie in der Regel in Form ihrer Triacylglyceride (= Triglyceride = Triglycerole) an- 
fallen. Sie konnen aber auch aus Tieren wie z.B. Fischen gewonnen werden. Die freien 
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Fettsauren werden vorteilhaft durch Verseifung hergestellt Hohere mehrfach ungesat- 
tigte Fettsauren wie DHA, EPA, Arachidonsaure (= ARA, 020:4^ Dihomo-y- 
linolensaure (C20:3 48 - 11 - 14 ) oder Docosapentaensaure (DPA, C22:5 A7,10> ' 3 ' 16,19 ) lassen 
sich nicht aus Olfruchtpflanzen wie Raps, Soja, Sonnenblume, Farberdistel Oder ande- 
5 ren isolieren. Obliche naturliche Quellen fQr diese Fettsauren sind Fische wie Hering 
Lachs, Sardine, Goldbarsch, Aal, Karpfen, Forelle, Heilbutt, Makrele, Zander oder 
Thunfisch oder Aigen. 

Je nach Anwendungszweck sind Ole mit gesattigten oder ungesattigten Fettsauren 
bevorzugt, so sind z.B. in der humanen Ernahrung Lipide mit ungesattigten Fettsauren 
1 0 spezieil mehrfach ungesattigten Fettsauren bevorzugt Den mehrfach ungesattigten w- 
3-Fettsauren wir dabei ein positiver Effekt auf den Cholesterinspiegel im Blut und damft 
auf die MSglichkeit der Prevention einer Herzerkrankung zugeschrieben. Durch Zugabe 
dieser w-3-Fettsauren zu Nahrung kann das Risiko einer Herzerkrankung, eines 
Schlaganfails oder von Bluthochdruck deutlich verringert werden. Auch entzOndliche 

•15 spezieil chronisch entzQndliche Prozesse im Rahmen immunologischer Erkrankungen 
I wie rheumatroider Arthritis lassen sich durch w-3-Fettsauren positiv beeinflussen. Sie 
werden deshalb Lebensmitteln spezieil diatischen Lebensmitteln zugegeben oder fin- 
den in Medikamenten Anwendung. co-6-Fettsauren wie Arachidonsaure haben bei die- 
sen rheumatischen Erkrankungen aufgrund unserer Oblichen Nahrungsmittelzusam- 
20 mensetzung eher einen negativeh Effekt auf diese Krankheiten. 

w-3- und w-6-Fettsauren sind Voriaufer von Gewebshormonen, den sogenannten Ei- 
cosanoiden wie den Prostaglandinen, die sich von der Dihomo-Y-linolensaure, der Ara- 
chidonsaure und der Eicosapentaensaure ableiten, den Thromoxanen und Leukotrie- 
nen, die sich von der Arachidonsaure und der Eicosapentaensaure ableiten. Eicosa- 
25 noide (sog. PGz-Serie), die aus w-6-Fettsauren gebildet werden f6rdern in der Regel 
Entzundungsreaktionen, wahrend Eicosanoide (sog. PG 3 -Serie) aus w-3-Fettsauren 
geringe oder keine entzQndungsfordernde Wirkung haben. 

• Aufgrund ihrer positiven Eigenschaften hat es in der Vergangenheit nicht an Ansatzen 
gefehlt, Gene, die an der Synthese von Fettsauren bzw. Triglyceriden beteiligt sirid, fQr 
0 die Herstellung von Olen in verschiedenen Organismen mit geandertem Gehalt 

an ungesattigten Fettsauren verfOgbar zu machen. So wird in WO 91/13972 und sei- 
nem US-Aquivalent eine A-9-Desaturase beschrieben! In WO 93/1 1245 wird eine A— 
15-Desaturase in WO 94/11516 wird eine A-12-Desaturase beansprucht Weitere 
Desaturasen werden beispielsweise in EP-A-0 550 162, WO 94/18337 WO 97/30582 
35 WO 97/21340, WO 95/18222, EP-A-0 794 250, Stukey et al., J. Biol. Chem., 265 

1990: 20144-20149, Wada et al., Nature 347, 1990: 200-203 oder Huang et'al., Lipids 
34, 1999: 649-659 beschrieben. Die biochemische Charakterisierung der verschiede- 
nen Desaturasen ist jedoch bisher nur unzureichend erfolgt da die Enzyme als memb- 
rangebundene Proteine nur sehr schwer zu isolieren und zu charakterisieren sind 
40 (McKeon et al., Methods in Enzymol. 71 , 1 981 : 1 2141-1 2 147, Wang et al., Plant Phy- 
siol. Biochem., 26, 1988: 777-792). In der Regel erfolgt die Charakterisierung mem- 
brangebundener Desaturasen durch Einbringung in einen geeigneten Organismus, der 
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ans^lieBend auf Enzymaktivitat mittels Edukt- und Produktanalyse untersucht wird A— 
6-Desaturasen werden in WO 93/06712. US 5,614,393, US5614393 WO 96/21022 
WO00/21557 und WO 99/271 1 1 beschneben und auch die Anwendun^zu ^P^on 
in transgenen Organismen beschneben wie in W098/46763 W098/46764 ™ dUkt, ° n 
W09846765. Dabei wird auch die Expression verschiedener Desaturasen wf 6 in 
W099/64616 Oder W098/46776 und Biidung P^I^JS^^^^ 
und beansprucht Bzgl. der Effektivitat der Expression von Desaturasen un ^rTn Sf 
flussaufdieBiidungpo^ngesa^ 

s.on e.ner e.nzelnen Desaturase wie higher beschneben iediglich geringe Gehate a^ 
ungesatbgten Fettsauren/Lipiden wie z.B. v-Linoiensaure und S^^SmS^^Sa 
wurdea Werterhin wurde in der Rege. ein Gemisch aus W -3- una^FetTu^L. 

Besonders geeignete Mikroorganismen zur Herstellung von PUFAs sind Mikrooroa- 
msmen we Thraustochytrien Oder Schizcchytrien^tamme, Aigen wie PhaeoSum 
tncornutum Oder Crypthecodinium-Arten, Ciliaten, wie Stylonychia oTer Stoidfum P^ 

lonZZTT' Ent °r Phth0ra ° der MUCOr ' ° Urch ^mLeieiZ £££££ 
von Mutantenstamrnen der entsprechenden Mikroorganismen entwickelt worden, dte 
e ne Re.he wunschenswerter Verbindungen, einschlieSlich PUFAs, produzieren C Me 
Mutet,on und Selektion von Stammen mit verbesserter Produktion einerb^mmten 
MolekQIs wie den mehrfach ungesattigten Fettsauren ist jedoch ein^ubendes und 
schvwenges Verfahren. Deshaib werden, wenn immer moglich JTcSESS^ 
gentechnolog,sche Verfahren bevorzugt. Mit Hiife der vorgenannten Mikroo^ganrsmen 
lessen sich jedoch nur begrenzte Mengen der gewunschSn mehrfaZSgten 
Fettsauren w,e DPA EPA Oder ARA hersteilen. Wobei diese in der Regei^nach ver- 
DTaSiien r9anlSmUS * FeteaU ^ emjsche « beispieisweise^PA DPA und 

T^!T n dl l? roduktion von Feinchemikalien im groGen MaRstab vorteilhaft Ober 
d.e Produkton m Pflanzen durchgefOhrt werden, die so entwickelt werden das" ste dte 
vorstehend genannten PUFAs hersteilen. Besonders gut fOr diesen Zweck geetgnete 

^Cano.a "TT^ * *"* an Li P id -^ungen entha in wie 

Raps, Canola, Lein, Soja, Sonnenblumen, Borretsch und Nachtkerze Aber aurh LhI 
re Nutzpflanzen, die Ole oder Lipide und Fettsauren eniSXZ wietn 
der e,ngehenden Beschreibung dieser Erfindung erwahnt Mittels heLSher 
tung ,st e,ne Reihe von Mutantenpflanzen entwickelt worden, die ein SpeZm an 

rrl e r erten U SL d6n ^ FettS§Uren " C ° faktoren und P~ en 
?2l f h° T & Pflan2ensorten mit verbesserter Produktion eines bestimmten Mo- 
lekuls , st jedoch e,n ze.taufwandiges und schwieriges Verfahren oder soger unTo^ch 
wenn d.e Verb.ndung in der entsprechenden Pflanze nicht natUrlich vorSmm ™* m ' 
Fa ,1 von mehrfach ungesattigten C 18 , Oao-Fettsauren und C^Fettsauren und soThe^ 
mit langeren Kohlenstoffketten. soicnen 

Po^Ven Eigenschaften ungesattigter Fettsauren hat es in der Vergan- 
genhert n.cht an Ansatzen gefehlt, diese Gene, die an der Synthese von Fettsauren 
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bzw. Triglyceriden beteiligt sind, fOr die Herstellung von Olen in verschiedenen Pflan- 
zen mit einem geandertem Gehalt an mehrfach ungesattigten Fettsauren verfQgbar 
zu machen. Bisher konnteh jedoch langerkettige mehrfach ungesattigte C 20 - und/oder 
Czr-Fettsauren wie EPA oder ARA nicht in Pflanzen hergestellt werden. 

Aber auch in anderen Organismen wie Mikroorganismen wie Algen oder Pilzen fiihrten 
die gentechnischen Veranderungen des Fettsaurestoffwechselweges Qber das Ein- 
bringen und die Expression beispielsweise von Desaturasen nurzu relativ geringen 
Steigerungen der Produktivitat in diesen Organismen. Ein Grund hierfur mag in dem 
sehr komplexen Fettsaurestoffwechsel liegen. So ist der Bnbau von mehrfach unge- 
sattigten Fettsauren in Membranlipide und/oder in Triacylglyceride und deren Ab- und 
Umbau sehr komplex und bis heute biochemisch und speziell genetisch noch nicht 
vollstandig aufgeklart und verstanden. 

Die Biosynthese von LCPUFAs und der Einbau von LCPUFAs in Membranen oder 
Triacylglyceride erfolgt Qber verschiedene Stoffwechselwege (Abbadi et al. (2001) 
European Journal of Lipid Science & Technology 103:106-1 13). In Bakterien wie Vibrio 
und Mikroalgen wie Schizochytrium wird Malonyl-CoA Ober eine LCPUFA- 
produzierende Polyketidsynthase zu LCPUFAs umgesetzt (Metzet al. (2001) Science 
293: 290-293; WO 00/42195; WO 98/27203; WO 98/55625). In Mikroalgen wie Phaeo- 
dactylum und Moosen wie Physcomitrella werden ungesattigte Fettsauren wie Linol- 
saure oder Linolensaure in Form ihrer Acyl-CoAs in mehreren Desaturierungs- und 
Elongationsschritten zu LCPUFAs umgesetzt (Zank etal. (2000) Biochemical Society 
Transactions 28: 654-658). Bei Saugetieren beinhaltet die Biosynthese von DHA zu- 
satzlich zu Desaturierungs- und Elongationsschritten eine Kettenverkurzung Qber B- 
Oxidation. 

LCPUFAs liegen in Mikroorganismen und niederen Pflanzen entweder ausschlieBiich 
in Form von Membranlipiden vor. wie bei Physcomitrella und Phaeodactylum oder sie 
sind in Membranlipiden und Triacylglyceriden vorhanden, wie bei Schizochytrium und 
Mortierella. Der Einbau von LCPUFAs in Lipide und Ole wird durch verschiedene - 
Acyltransferasen und Transacylasen katalysiert Diese Enzyme sind bereits bekanntfur 
den Einbau von gesattigten und ungesattigten Fettsauren [Slabas (2001) J. Plant Phy- 
siology 158: 505-513; Frentzen (1998) Fett/Lipid 100: 161-166); Cases etal. (1998) 
Proc. Nat Acad. Sci. USA 95: 13018-13023]. Bei den Acyltransferasen handelt sich urn 
Enzyme des sogenannten Kennedy-Pathways, die an der cytoplasmatischen Seite des 
Membransystems des Endoplasmatischen Reticulums, nachfolgend als ,ER' bezeich- 
net lokalisiert sind. Experimentell konnen Membranen des ER als sogenannte .mikro- 
somale Fraktionen' aus verschiedenen Organismen isoliert werden (Knutzon et al. 
(1995) Plant Physiology 109: 999-1006; Mishra & Kamisaka (2001) Biochemistry 355: 
315-322; US 5968791). Diese ER-gebundenen Acyltransferasen in der mikrosomalen 
Fraktion verwenden Acyl-CoA als aktivierte Form der Fettsauren. Glycerin-3-phosphat 
Acyltransferase, im folgenden GPAT genannt, katalysiert den Einbau von Acylgruppen 
an dersn-1 Position von Glycerin-3-phosphat. 1-Acylglycerin-3-phosphat Acyltransfe- 
rase (EC. 2.3.1.51), auch Lysophosphatidsaure Acyltransferase, im folgenden LPAAT 
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genannt, katalysiert den Einfaau von Acylgruppen an der sn-2 Position von Ly- 
sophosphatidsaure, nachfolgend als LPA abgekurzt. Nach Dephosphorylierung von 
Phosphatidsaure durch Phosphatidsaure Phosphatase katalysiert Diacylglycerin A- 
cyltransferase, im folgenden DAGAT genannt, den Einbau von Acylgruppen an der sn- 
3 Position von Diacylglycerins. Neben diesen Kennedy Pathway Enzymen sind weitere 
Enzyme am Einbau von Fettsauren in Triacylglyceride beteiligt, die Acylgruppen aus 
Membranlipiden in Triacylglyceride einbauen k6nnen. Phospholipid Diacylglycerin A- 
cyltransferase, nachfolgend PDAT genannt, und Lysophosphatidylcholin Acyltransfera- 
se, nachfolgend LPCAT genannt. 

Die enzymatische Aktivitat einer LPCAT wurde erstmals in Ratten beschrieben [Land 
(1960) Journal of Biological Chemistry 235: 2233-2237]. In Pflanzen existiert eine 
plastdare Isoform der LPCAT [Akerrnoun et al. (2000) Biochemical Society Transacti- 
ons 28: 713-715] sowie eine ER gebundene Isoform [Tumaney und Rajasekharan 
(1999) Biochimica et Biophysica Acta 1439: 47-56; Fraser und Stobart, Biochemical 
Society Transactions (2000) 28: 715-7718]. LPCAT ist in Tieren wie auch in Pflanzen 
an der B.osynthese und der Transacylierung von mehrfach ungesattigten Fettsauren 
bete.ligt [Stymne und Stobart (1984) Biochem. J. 223: 305-314; Stymne und Stobart 
(1987) in 'The Biochemistry of Plants: a Comprehensive Treatise', Vol. 9 (Stumpf P K 
ed.) pp. 175-214, Academic Press, New York], Eine wichtige Funktion der LPCAT oder 
allgememer gesagt einer Acyl-CoA:Lysophospholipid Acyltransferase, nachfolgend 
LPLAT genannt, bei der ATP-unabhangigen Synthese von Acyl-CoA aus Phospholipi- 
den wurde von Yamashita et al. (2001; Journal of Biological Chemistry 276- 26745- 
26752) beschrieben. 

Trotz vieler biochemischer Daten konnten bisher keine Gene kodierend fur LPCAT 
identifiziert werden. Gene anderer verschiedener pflanzlicher Acyltransferasen konnten 
isoliert werden und werden in WO 00/18889 (Novel Plant Acyltransferases) beschrie- 
ben. 

H6here Pflanzen enthalten mehrfach ungesattigte Fettsauren wie Linolsaure (C18-2) 
und Lmolensaure (C18:3). Arachidonsaure (ARA), Eicosapentaensaure (EPA) und Do- 
cosahexaensaure (DHA) kommen wie oben beschrieben im Samenol hoherer Pflanzen 
gar n«cht oder nur in Spuren vor (E. Ucciani: Nouveau Dictionnaire des Huiles Vegeta- 
les. Technique & Documentation - Lavoisier, 1995. ISBN: 2-7430-0009-0) Es ist vor- 
teHhaft, in hdheren Pflanzen, bevorzugt in Olsaaten wie Raps, Lein, Sonnenblume und 
Soja, LCPUFAs herzustellen, da auf diese Weise grofte Mengen qualitativ hochwerti- 
ger LCPUFAs fur die Lebensmittelindustrie, die Tferernahrung und fOr pharmazeuti- 
sche Zwecke kostengOnstig gewonnen werden kSnnen. Hierzu werden vorteilhaft Ober 
gentechnische Methoden Gene kodierend fQr Enzyme der Biosynthese von LCPUFAs 
in Olsaaten eingefuhrt und exprimiert werden. Dies sind beispielsweise Gene kodie- 
rend fQr A-6-Desaturase, A-6-Elongase, A-5-Desaturase, A-5-Elongase und A-4- 
Desaturase. Diese Gene kfinnen vorteilhaft aus Mikroorganismen, Tieren und niederen 
Pflanzen isoliert werden, die LCPUFAs herstellen und in den Membranen oder Tri- 
acylglyceriden einbauen. So konnten bereits A-6-Desaturase-Gene aus dem Moos 
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Physcomitrella patens und A-6-Elongase-Gene aus P. patens und dem Nematoden C. 
elegans isoliert. 

Erste transgene Pflanzen, die Gene kodierend for Enzyme der LCPUFA-Biosynthese 
enthalten und exprimieren und LCPUFAs produzieren wurden beispielsweise in 
DE 102 19 203 (Verfahren zur Herstellung mehrfach ungesattigter Fettsauren in Pflan- 
zen) erstmals beschrieben. Diese Pflanzen produzieren allerdings LCPUFAs in Men- 
gen, die fur eine Aufarbeitung der in den Pflanzen enthaltenen Ole noch weiter opti- 
miert werden mUssen. 

Urn eine Anreicherung der Nahrung und des Futters mit diesen mehrfach ungesSttigten 
Fettsauren zu ermoglichen, besteht daher ein grafter Bedarf an einem einfachen, kos- 
tengOnstigen Verfahren zur Herstellung dieser mehrfach ungesSttigten Fettsauren spe- 
ziell in eukaryontischen Systemen. 

Es bestand daher die Aufgabe ein Verfahren zur Herstellung von mehrfach ungesattig- 
ten Fettsauren in einem eukaryontischen Organismus zu entwickeln. Diese Aufgabe 
wurde durch das erfindungsgema&e Verfahren zur Herstellung mehrfach ungesattigter 
Fettsauren in einem Organismus, dadurch gekennzeichnet, dass das Verfahren - 
folgende Schritte umfasst: 

a) Einbringen mindestens einer Nukleinsauresequenz in den Organismus mit der 
in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 dargestell- 
ten Sequenz, die fur ein Polypeptid mit einer Acyl-CoALysophospholipid- 
Acyltransferaseaktivitat codiert; oder 

b) Einbringen mindestens einer Nukleinsauresequenz in den Organismus, die 
sich als Ergebnis des degenerierten genetischen Codes von der in SEQ ID 
NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 enthaltenden codie- 
renden Sequenz ableiten lasst, oder 

c) Einbringen mindestens eines Derivates der in SEQ ID NO: 1 , SEQ ID NO: 3, 
SEQ ID NO: 5 oder SEQ ID NO: 7 dargestellten Nukleinsauresequenz in den 
Organismus, die filr Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, SEQ 
ID NO: 6 oder SEQ ID NO: 8 dargestellten Aminosauresequenz codieren und 
mindestens 40 % Homologie auf Aminosaureebene mit SEQ ID NO: 2, SEQ ID 
NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 8 aufweisen und eine aquivalente A- 
cyl-CoA:Lysophospholipid-Acyltransferaseaktivitat aufweisen, und. 

d) kultivieren und emten des Organismus. 

Vorteilhaft enthalten die im erfindungsgema&en Verfahren hergestellten mehrfach un- 
gesattigten Fettsauren mindestens zwei vorteilhaft drei Doppelbindungen. Besonders 
vorteilhaft enthalten die Fettsauren vier oder fOnf Doppelbindungen. InrVerfahren her- 
gestellte Fettsauren haben vorteilhaft 16-, 18-, 20- oder 22 C-Atome in der Fettsaure- 
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kette. Diese hergestellten Fettsauren konnen als einziges Produkt im Verfahren herge- 
stellt werden Oder in einem Fettsauregemisch vorliegen. 

Bei den im erfindungsgemSSen Verfahren verwendeten Nukleinsauresequenzen han- 
delt es sich urn isolierte Nukleinsauresequenzen, die fur Polypeptide mit Acyl- 
CoA:Lysophospholipid-Acyltransferaseaktivit§t.codieren. 

Die im Verfahren hergestellten mehrfach ungesattigten Fettsauren sind vorteiihaft in 
Membranlipiden und/oder Triacylglyceriden gebunden, kdnnen aber auch als frei Fett- 
sauren oder aber gebunden in Form anderer Fettsaureester in den Organismen vor- 
kommen. Dabei k6nnen sie wie gesagt als "Reinprodukte" oder aber vorteiihaft in Form 
von Mischungen verschiedener Fettsauren oder Mischungen unterschiedlicher Glyceri- 
de vorliegen. Dabei lassen sich die in den Triacylglyceriden gebundenen verschieden 
Fettsauren von kurzkettigen Fettsauren mit 4 bis 6 C-Atomen, mittelkettigen Fettsauren 
mit 8 bis 12 C-Atomen oder langkettigen Fettsauren mit 14 bis 24 C-Atomen ableiten, 
bevorzugt sind die langkettigen Fettsauren besonders bevorzugt sind die langkettigen 
Fettsauren LCPUFAs von C 18 -, C20- und/oder Caa-Fettsauren. 

Im erfindungsgema&en Verfahren werden vorteiihaft Fettsaureester mit mehrfach un- 
gesattigten C 16 r-, C ia -. C20- und/oder Caz-Fettsauremolekulen mit mindestens zwei 
Doppelbindungen im Fettsaureester hergestellt Bevorzugt enthalten diese Fettsaure- 
molekule drei, vier oder fOnf Doppelbindungen und fQhren vorteiihaft zur Synthese von 
Hexadecadiensaure (C16:2 A9 - 12 ), v-Linolensaure (= GLA, C18:3 A6 - 9 - 12 ), Stearidonsaure 
(= SDA, C18:4 A6A12 - 15 >- Dihomo-Y-Linolensaure (= DGLA, 20:3 A8 - 11 - 14 ), Eicosatetraen- 
saure (= ETA, C20:4 A5 8 - 11 - 14 ). Arachidonsaure (ARA), Eicosapentaensaure (EPA) Oder 
deren Mischungen, bevorzugt EPA und/oder ARA. 

Die Fettsaureester mit mehrfach ungesattigten C 16 -, C 18 -, Car und/oder 
FettsauremolekDIen konnen aus den Organismen, die fur die Herstellung der Fettsau- 
reester verwendet wurden, in Form eines Cls oder Lipids beispielsweise in Form von 
Verbindungen wie Sphingolipide, Phosphoglyceride, Lipide, Glycolipide wie Gly- 
cosphingolipid, Phospholipide wie Phosphatidylethanolamin, Phosphatidylcholin, 
Phosphatidylserin, Phosphatidylglycerol, Phosphatidylinositol oder Diphosphatidylgly- 
cerol, Monoacylglyceride, Diacylglyceride, Triacylgiyceride oder sonstige Fettsaurees- 
ter wie die AcetylCoenzymA-Ester, die die mehrfach ungesattigten Fettsauren mit min- 
destens zwei bevorzugt drei Doppelbindungen enthalten, isoliert werden. Neben diesen 
Estem sind die mehrfach ungesattigten Fettsauren auch als freie Fettsauren oder ge- 
bunden in anderen Verbindungen in den Organismen vorteiihaft den Pflanzen enthal- 
ten. In der Regel liegen die verschiedenen vorgenannten Verbindungen (Fettsaurees- 
ter und frei Fettsauren) in den Organismen in einer ungefahren Verteilung von 80 bis 
90 Gew.-% Triglyceride, 2 bis 5 Gew.-% Diglyceride, 5 bis 10 Gew.-% Monoglyceride. 
1 bis 5 Gew.-% freie Fettsauren, 2 bis 8 Gew.-% Phospholipide vor, wobei sich die 
Summe der verschiedenen Verbindungen zu 100 Gew.-% erganzt. 

Im erfindungsgemalien Verfahren werden die hergestellten LCPUFAs mit einem Ge- 
halt von mindestens 3 Gew.-%, vorteiihaft von mindestens 5 Gew.-%, bevorzugt von 
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mindestens 8 Gew.-%, besonders bevorzugt von mindestens 10 Gew.-%, ganz beson- 
de re bevorzugt von mindestens 15 Gew,% bezogen auf die gesamten FeSenT 
dertransgenen Orgamsmen vorteilhaft in einer transgenen Pflanze hergest al" Da im 

foi « "T 9 T- en J erfahren V ° n den A ^gangsverbindungen Hexadecadiensau e 
(C16:2) L.no.saure (C18:2) bzw. Linolensaure (C18:3) mehrere Reaktion^schritte 
durchjaufen werden, fallen die Endprodukte des Verfahrens wie beispielswSeXachi- 
donsaure (ARA) oder Eicosapentaensaure (EPA) nicht als absolute Lni^ZtoT 
es s.nd .mmer auch gennge Spuren der Vorstufen im Endprodukt entha ^IteTsin^ in 
dem Ausgangsorgamsmus bzw. in der Ausgangspflanze beispielsweise sowohmnol- 
saure als auch Unolensaure vorhanden, so liegen die Endprodukte wie ARA und EPA 
als M,schungen vor Die Vorstufen sollten vorteilhaft nicht mehr als 20 GewT be^- 
zugt n.cht mehr als 15 Gew.-%, besonders bevorzugt nicht als 10 Gew -% 
ganz besonders bevorzugt nicht mehr als 5 Gew.-% bezogen auf die Menqe des iewei 

5E!^^ werden ln einer fransgenen 

dukte nur ARA oder nur EPA .m erfindungsgemalien Verfahren gebunden oder als 
fre,e Sauren hergestellt Werden beide Verbindungen (ARA + EPA) gleichzlg heme- 
stellt, werden s,e vorteilhaft in einem Verhaltnis von mindesten 1:2 (EPAARA) voW- 
haft von m,ndestens 1:3, bevorzugt von 1:4, besonders bevorzugt Jon 1:5herg'^ 

Durch die erfindungsgemalien Nukleinsauresequenzen kann eine Steigerung der Aus- 
beute an mehrfach ungesattigten Fettsauren von mindestens 50 %, vorteilhaft von 
mindestens 80 %, besonders vorteilhaft von mindestens 100 % ganz besonders vor 
teilhaft von mindestens 150 % gegenOber den nicht transgenen Au^^smus 
be.m Vergle.ch rn der GC-Analyse siehe Beispiele erreicht werden. 9SOrgan,Smus 

Auch chemisch reine mehrfach ungesSttigte Fettsauren oder Fettsaurezusammenset- 
zungen s,nd nach den vorbeschriebenen Verfahren darstellbar. Dazu werden die Fett- 
sauren Oder d,e Fetteaurezusammensetzungen aus dem Organismus 7e den 2- 
gamsmen oder den Pflanzen oder dem Kulturmedium, in dem oder auf dem die Orga 
n.smen angezogen wurden, oder aus dem Organismus und dem Kulturmedium in be- 
^'T' 86 ° ber EXtrakti ° n ' DeSti " ation - Kristallisation, Chroma 
IT nat, ° nen di6Ser Meth ° den lsoljert - Diese ^isch reinen Fett- 
sauren oder Fettsaurezusammensetzungen sind fur Anwendungen im Bereich der Le- 
bensm,tte,industne, der Kosmetikindustne und bescnders der P^indu^e^rtet 

ntl^ntT He D ? e " Un 9 m ^ndungsgemalJen Verfahren kommen prinzi- 

p.ell alls Organismen w,e P,lze wie Mortierella oder Traustochytrium, Hefen wie Sac- 
charomyces Oder Schizosaccharomyces, Moose wie Phys—la oder Ce^on 
^SST ™ Caenorhabditis ' ^ Crypthecodinium oder Phaeodac^- 
urn oder Pflanzen w.e zwe.keimblattrige oder einkeimblattrige Pflanzen in Frage Vo^ 
te haft werden Organismen im erfindungsgemafcen Verfahren verwende" die zu den 
Ol-produz.erenden Organismen gehoren, das heiBt die fur die Herstellung von Olen 
ve^endet werden, wie Pilze wie Mortierella oder Traustochytnum, AJgen Je C^the- 
cod.n,um, Phaecdactylum Oder Pflanzen, insbesondere Pflanzen bevLugtOlfS 
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pflanzen, die grofce Mengen an Lipidverbindungen enthalten, wie Erdnuss, Raps, Ca- 
nola, Sonnenblume. Safflor (Farberdistel), Mohn, Senf, Hanf, Rizinus, Olive, Sesam, 
Calendula, Punica, Nachtkerze, Kdnigskerze, Distel, Wildrosen, Haselnuss, Mandel,' 
Macadamia, Avocado, Lorbeer, KGrbis, Lein, Soja, Pistazien, Borretsch, Baume (Ol- 
palme, Kokosnuss oderWalnuss) oder FeldfrQchte, wie Mais, Weizen, Roggen, Hafer, 
Triticale, Reis, Gerste, Baumwolle, Maniok, Pfeffer, Tagetes, Solanaceen-Pflanzen, wie 
Kartoffel. Tabak, Aubergine und Tomate, Vicia-Arten, Erbse, Alfalfa oder Buschpflan- 
zen (Kaffee, Kakao, Tee), Salix-Arten sowie ausdauernde Graser und FutterfeldfrQchte. 
Bevorzugte erfindungsgema&e Pflanzen sind Olfruchtpflanzen, wie Erdnuss, Raps, . 
Canola, Sonnenblume, Safflor (Farberdistel), Mohn, Senf, Hanf, Rhizinus, Olive, Ca- 
lendula, Punica, Nachtkerze, KOrbis, Lein, Soja, Borretsch, Baume (Olpalme, Kokos- 
nuss). Besonders bevorzugt sind C18:2- und/oder C18:3-Fettsaure reiche Pflanzen wie 
Sonnenblume, Farberdistel, Tabak, Konigskerze, Sesam, Baumwolle, KQrbis, Mohn, 
Nachtkerze, Walnuss, Lein, Hanf, Distel oder Farberdistel. Ganz besonders bevorzugt 
sind Pflanzen wie Farberdistel, Sonnenblume, Mohn, Nachtkerze, Walnuss Lein oder 
Hanf. 

Fur das erfihdungsgema&e beschriebene Verfahren ist es vorteilhaft in den Organis- 
mus zusatzlich zu den unter Verfahrensschritt (a) bis (c) eingebrachten Nukleinsauren 
zusatzlich weitere Nukleinsauren einzubringen, die fur Enzyme des Fettsaure- oder 
Lipidstoffwechsels codieren. 

Im Prinzip konnen alle Gene des Fettsaure- oder Lipidstoffwechsels vorteilhaft in 
Kombination mit der erfinderischen Acyl-CoA:Lysophospholipid-Acyltransferase im 
Verfahren zur Herstellung mehrfach ungesattigter Fettsauren verwendet werden vor- 
teilhaft werden Gene des Fettsaure- oder Lipidstoffwechsels ausgewahlt aus der 
Gruppe Acyl-CoA-Dehydrogenase(n), Acyl-ACP[= acyl earner protein]-Desaturase(n), 
Acyl-ACP-Thioesterase(n), Fettsaure-Acyi-Transferase(n), Fettsaure-Synthase(n), ' 
Fettsaure-Hydroxylase(n), Acetyl-Coenzym A-Carboxylase(n), Acyl-Coenzym A- 
Oxidase(n), Fettsaure-Desaturase(n), Fettsaure-Acetylenasen, Lipoxygenases Tria- 
cylglycerol-Lipasen, Allenoxid-Synthasen, Hydroperoxid-Lyasen oder Fettsaure- 
Elongase(n) in Kombination mit der Acyl-CoA:Lysophospholipid-Acyltransferase ver- 
wendet Besonders bevorzugt werden Gene ausgewahlt aus der Gruppe der A-4- 
Desaturasen, A-5-Desaturasen, A-6-Desaturasen, A-8-Desatuasen, A-9-Desaturasen, 
A-12-Desaturasen, A-5-Elongasen, A-6-Elongasen oder A-9-Elongasen in Kombination 
mit der Acyl-CoALysophospholipid-Acyltransferase im erfindungsgemaBen Verfahren 
verwendet. 

Durch die enzymatische Aktivitat der im erfindungsgemafien Verfahren verwendeten 
Nukleinsauren, die fiir Polypeptide mit Acyl-CoALysophospholipid-Acyltransferase- 
aktivitat codieren, vorteilhaft in Kombination mit Nukleinsauresequenzen, die far Poly- 
peptide des Fettsaure- oder Lipidstoffwechsels wie A-4-, A-5-, A-6-, A-8-Desaturase- 
oder A-5-, A-6-oder A-9-Elongaseaktivitat codieren, konnen unterschiedlichste mehr- 
fach ungesattigte Fettsauren im erfindungsgem§fien Verfahren hergestellt werden. 
Je nach Auswahl der fur das erfindungsgemalie Verfahren verwendeten Organismen 
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wie den vorteilhaften Pflanze lessen sich Mischungen der verschiedenen mehrfach 
ungesatbgten Fettsaure oder einzelne mehrfach ungesattigte Fettsauren wie EPA Oder 
ARA in freier oder gebundener Form herstellen. Je nachdem welche Fettsaurezusam- 
mensetzung in der Ausgangspflanze vorherrscht (C18:2- oder C18:3-Fettsauren) ent- 
stehen so Fettsauren, die sich von C18:2-Fettsauren ableiten, wie GLA, DGLA oder 
•ARA oder. die sich von C18:3-Fettsauren ableiten, wie SDA, ETA oder EPA Liegt in 

?I a )Stf verwendeten ™™ ze a«s ungesattigte Fettsaure nur Linolsaure 
(- LA, 018:2" • ) vor, so konnen als Produkte des Verfahrens nur GLA, DGLA und 
ARA entstehen, die als freie Fettsauren oder gebunden voriiegen K6nnen. 1st in der im 
X!?2?5 J? ^ 6ndeten Pflan2e als un 9 esat H9te Fettsaure nur a-Linolensaure (= ALA 
oi! CT ' } be,s P ie,sweise ™ e j n Lein, so konnen als Produkte des Verfahrens nur 
SDA, ETA und EPA entstehen, die wie oben beschrieben als freie Fettsauren oder 
gebunden voriiegen konnen. Durch Modifikation der Aktivitat der an der Synthese be- 
teiligten Enzyme Acyl-CoA:Lysophospholipid-Acyltransferase vorteilhaft in Kombination 
mit der A-5-, A-6-Desaturase und A-6-Bongase, oder der A-5-, A-8-Desaturase 
und A-9-Elongase oder in Kombination mit nur den ersten beiden Gene A-6- 
Desaturase und A-6-Elohgase oder A-8-Desaturase und A-9-Elongase der Synthe- 
sekette lassen sich gezielt in den vorgenannten Organismen vorteilhaft in den vorge- 
nannten Pflanzen nur einzelne Produkte herstellten. Durch die Aktivitat der A-6- 
Desaturase und A-6-Elongase entstehen beispielsweise GLA und DGLA bzw SDA 
und ETA, je nach Ausgangspflanze und ungesattigter Fettsaure. Bevorzugt entstehen 
DGLA bzw. ETA oder deren Mischungen. Wird die A-5-Desaturase zusStzlich in die 
Organismen vorteilhaft in die Pflanze eingebracht, so entstehen zus§tzlich ARA oder 
EPA. Dies gilt auch fur Organismen in die vomer die A-8-Desaturase und A-9- 
Elongase eingebracht wurde. Vorteilhaft werden nur ARA oder EPA oder deren Mi- 
schungen synthetisiert, abhangig von der in im Organismus bzw. in der Pflanze vorlie- 
genden Fettsaure, die als Ausgangssubstanz fOr die Synthese dient. Da es sich urn 
Biosyntheseketten handelt, liegen diejeweiligen Eridprodukte nichtals Reinsubstanzen 
in den Organismen vor. Es sind immer auch geringe Mengen der Voriauferverbinduri- 
gen im Endprodukt enthalten. Diese geringen Mengen betragen weniger als 20 Gew - 
%, vorteilhaft weniger als 15 Gew.-%, besonders vorteilhaft weniger als 10 Gew -% 
ganz besonders vorteilhaft weniger als 5, 4, 3, 2 oder 1 Gew.-% bezogen auf das End- 
produkt DGLA, ETA oder deren Mischungen bzw. ARA EPA oder deren Mischungen. 

Zur Steigerung der Ausbeute im beschriebenen Verfahren zur Herstellung von Olen 
und/oder Triglyceriden mit einem vorteilhaft erhohten Gehalt an mehrfach ungesattig- 
ten Fettsauren ist es vorteilhaft die Menge an Ausgangsprodukt fur die Fettsauresyn- 
these zu steigem, dies kann beispielsweise durch das Einbringen einer Nukleinsaure in 
den Organismus, die fOr ein Polypeptid mit A-12-Desaturase codiert, erreicht werden 
Dies ist besonders vorteilhaft in Ol-produzierenden Organismen wie Raps, die einen 
hohen Olsauregehalt aufweisen. Da diese Organismen nur einen geringen Gehalt an 
Linolsaure aufweisen (Mikoklajczak et al., Journal of the American Oil Chemical Socie- 
ty, 38, 1961, 678 - 681) ist die Verwendung der genannten A-12-Desaturasen zur Her- 
stellung des Ausgangsprodukts Linolsaure vorteilhaft. 
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Im erfindungsgema&en Verfahren verwendeten Nukleinsauren stammen vorteilhaft aus 
Pflanzen wie Algen wie Isochrysis oder Crypthecodinium, Algen/Diatomeen wle 
Phaeodactylum, Moose wie Physcomitrella oder Ceratodon oder hoheren Pflanzen 
wie den Primulaceae wie Aleuritia, Calendula stellata, Osteospermum spinescens oder 
Osteospermum hyoseroides, Mikroorganismen wie Pilzen wie Aspergillus, Thrausto- 
chylrium, Phytophtora, Entpmophthora, Mucoroder Mortierella, Hefen oderTieren wie 
Nematoden wie Caenorhabditis, Insekten oder dem Mensch. Vorteilhaft stammen die 
Nukleinsauren aus Pilzen, Tieren oder aus Pflanzen wie Algen oder Moosen, bevor- 
zugt aus Nematoden wie Caenorhabditis. 

Vorteilhaft werden im erfindungsgemaSen Verfahren die vorgenannten Nukleinsaure- 
sequenzen oder deren Derivat oder Homologe, die fur Polypeptide codieren, die noch 
die enzymatische Aktivitat der durch Nukleinsauresequenzen codierten Proteine besit- 
zen. Diese Sequenzen werden einzeln oder in Kombination mit der fur die Acyl- 
CoALysophosphoiipid-Acyltransferase codierenden Nukleinsauresquenz in Expressi- 
onskonstrukte cloniert und zum Einbringen und zur Expression in Organismen verwen- 
deL Diese Expressionskonstrukte erm6glichen durch ihre Konstruktion eine vorteilhafte 
optimale Synthese der im erfindungsgemalien Verfahren produzierten mehrfach unge- 
sSttigten Fettsauren. 

Bei einer bevorzugten AusfQhrungsform umfasstdas Verfahren femer den Schritt des 
Gewinnens einer Zelle oder eines ganzen Organismus, der die im Verfahren verwen- 
deten Nukleinsauresequenzen enthalt, wobei die Zelle und/oder der Organismus mit 
der erfindungsgema&en Nukleinsauresequenz, die fur die Acyl-CoALysophospholipid- 
Acyltransferase codiert, einem Genkonstrukt oder einem Vektor wie nachfolgend be- 
schrieben, allein oder in Kombination mit weiteren Nukleinsauresequenzen, die fur Pro- 
teine des Fettsaure- Oder Upidsstoffwechsels codieren, transformiert wird. Bei einer 
weiteren bevorzugten AusfQhrungsform umfasst dieses Verfahren femer den Schritt 
des Gewinnens der Feinchemikalie aus der Kultur. Bei der Kultur kann es sich bei- 
spielsweise urn eine Fermentationskultur beispielsweise im Falle der Kultivierung von 
Mikroorganismen wie z.B. Mortierella, Saccharomyces oderTraustochytrium oder urn 
eine Treibhaus oder Feldkultur einer Pflanze handeln. Die so hergestellte Zelle oder 
der so hergestellte Organismus ist vorteilhaft eine Zelle eines Ol-produzierenden Or- 
ganismus wie einer Olfruchtpflanze wie beispielsweise Erdnuss, Raps, Canola, Lein, 
Hanf, Erdnuss, Soja, Safflower, Hanf, Sonnenblumen oder Borretsch. 

Unter Anzucht ist beispielsweise die Kultivierung im Falle von Pflanzenzellen, -gewebe 
oder-organe auf oder in einem Nahrmedium oder der ganzen Pflanze auf bzw. in ei- 
nem Substrat beispielsweise in Hydrokultur, Blumentopferde oder auf einem Ackerbo- 
den zu verstehen. 

Transgen" bzw. "Rekombinant" im Sinne der Erfindung bedeutet bezQglich zum Bei- 
spiel einer Nukleinsauresequenz, einer Expressionskassette (= Genkonstrukt) oder 
einem Vektor enthaltend die erfindungsgemaBe Nukleinsauresequenz oder einem Or- 
ganismus transformiert mit den erfindungsgemalien Nukleinsauresequenzen, Expres- 
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sionskassette Oder Vektor alle solche durch gentechnische Methoden zustandege- 
kommenen Konstruktionen, in denen sich entweder • 

a) die erfindungsgemaBe Nukleinsauresequenz, Oder 

b) eine mit der erfindungsgemaBen Nukleinsauresequenz funktionell verknOpfte 
genetische Kontrollsequenz, zum Beispiel ein Promotor, Oder 

c) (a) und (b) 

sich nicht in ihrer natOriichen, genetischen Umgebung befinden Oder durch gentechni- 
sche Methoden modifiziert wurden, wobei die Modifikation beispielhaft eine Substituti- 
on, Addrtion, Deletion, Inversion oder Insertion eines oder mehrerer Nukleotidreste sein 
kann. Nattirtiche genetische Umgebung meintden natOriichen genomischen bzw 
chromosomalen Locus in dem Herkunftsorganismus oder das Vortiegen in einer geno- 
mischen Bibliothek. Im Fall einer genomischen Bibliothek ist die natOrliche, genetische 
Umgebung der Nukleinsauresequenz bevorzugt zumindest noch teilweise erhalten Die 
Umgebung fiankiert die Nukleinsauresequenz zumindest an einer Seite und hat eine 
Sequenzlange von mindestens 50 bp, bevorzugt mindestens 500 bp, besonders bevor- 
zugt mindestens 1000 bp, ganz besonders bevorzugt mindestens 5000 bp." Eine natur- 
lich vorkommende Expressionskassette - beispielsweise die naturiich vorkommende 
Kombination des natOriichen Promoters der erfindungsgemaBen Nukleinsauresequenz 
mit dem entsprechenden Acyl-CoA:Lysophospholipid-Acyltransferase -Gen - wird zu 
emer transgenen Expressionskassette, wenn diese durch nicht-natOrliche, synthetische 
( kGnstliche") Verfahren wie beispielsweise einer Mutagenisierung geandert wird Ent- 
sprechende Verfahren sind beispielsweise beschrieben in US 5,565 350 oder 
WO 00/15815. ' 

Unter transgenen Organismus bzw. transgener Pflanze im Sinne der Erfindung ist wie 
vorgenanntzu verstehen, dass die im Verfahren verwendeten Nukleinsauren nicht an 
ihrer natOriichen Stelle im Genom eines Organismus sind, dabei konnen die Nuklein- 
sauren homolog oder heterolog exprimiert werden. Transgen bedeutet aber auch wie 
genannt, dass die erfindungsgemaBen Nukleinsauren an ihrem natOriichen Platz im 
Genom eines Organismus sind, dass jedoch die Sequenz gegenOber der natOriichen 
Sequenz verandert wurde und/oder das die Regulationssequenzen, der natOriichen 
Sequenzen verandert wurden. Bevorzugt ist unter transgen die Expression der erfin- 
dungsgemaBen Nukleinsauren an nicht natOrlicher Stelle im Genom zu verstehen das 
heifit eine homologe oder bevorzugt heterologe Expression der Nukleinsauren liegt 
vor. Bevorzugte transgene Organismen sind Pilze wie Mortierella oder Pflanzen sind 
die Orfruchtpflanzen. 

Als Organismen bzw. Wirtsorganismen fOr die im erfindungsgemaBen Verfahren ver- 
wendeten Nukleinsauren, die Expressionskassette oder den Vektor eignen sich prinzi- 
piell vorteilhaft alle Organismen, die in der Lage sind Fettsauren speziell ungesattigte 
Fettsauren zu synthetisieren bzw. for die Expression rekombinanter Gene geeignet 
sind. Beispielhaft seien Pflanzen wie Arabidopsis, Asteraceae wie Calendula oder Kul- 
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turpflanzen wie Soja, Erdnuss, Rizinus,' Sonnenblume, Mais, Baumwolle, Flachs, Raps, 
Kokosnuss, Olpalme, Farbersafflor (Carthamus tinctorius) Oder Kakaobohne, Mikroor- ' 
ganismen wie Pilze beispielsweise die Gattung Mortierella, Saprolegnia oder Pythium, 
Bakterien wie die Gattung Escherichia, Hefen wie die Gattung Saccharomyces, Cya- ' 
5 nobakterien, Ciliaten, Algen Oder Protozoen wie Dinofiagellaten wie Crypthecodinium 
genannt Bevorzugt werden Organismen, die natOrlicherweise Ole in grd&eren Mengen 
synthetisieren k6nnen wie Pilze wie Mortierella alpina, Pythium insidiosum Oder Pflan- 
zen wie Soja, Raps, Kokosnuss, Olpalme, Farbersafflor, Flachs, Hanf, Rizinus, Calen- 
dula, Erdnuss, Kakaobohne oder Sonnenblume Oder Hefen wie Saccharomyces cere- 
10 visiae, besonders bevorzugt werden Soja. Flachs, Raps, Farbersafflor, Sonnenblume, 
Calendula, Mortierella oder Saccharomyces cerevisiae. Prinzipiell sind als Wirtsorga- 
nismen neben den vorgenannten transgenen Organismen auch transgene Tiere vor- 
teilhaft nicht-humane Tiere geeignet beispielsweise C. elegans. 

Nutzbare Wirtszellen sind weiterhin genannt in: Goeddel, Gene Expression Technolo- 
gy: Methods in Enzymology 185, Academic Press, San Diego, CA (1990). 

f Verwendbare Expressionsstamme z.B. solche, die eine geringere Proteaseaktivitat 

aufweisen sind beschrieben in: Gottesman, S., Gene Expression Technology: Methods 
in Enzymology 1 85, Academic Press, San Diego, California (1 990) 1 1 9-1 28. 

Hierzu gehQren Pflanzenzellen und bestimmte Gewebe, Organe und Teile von Pflan- 
20 zen in all ihren Erscheinungsformen, wie Antheren, Fasern, Wurzelhaare, Stangel, 

Embryos, Kalli, Kotelydonen, Petiolen, Emtematerial, pflanzliches Gewebe, reprodukti- 
ves Gewebe und Zellkulturen, das von der eigentlichen transgenen Pflanze abgeleitet 
ist und/oder dazu verwendet werden kann, die transgene Pflanze hervorzubringen. 

Transgene Pflanzen, die die im erfindungsgemaBen Verfahren synthetisierten mehr- 
25 fach ungesattigten Fettsauren enthalten, kfinnen vorteilhaft direkt vermarktet werden 
ohne dass, die synthetisierten Ole, Lipide oder Fettsauren isoliert werden mOssen. Un- 
ter Pflanzen im erfindungsgemaften Verfahren sind ganze Pflanzen sowie alle Pflan- 
k zenteile, Pflanzenorgane oder Pflanzenteile wie Blatt, Stiel, Samen, Wurzel, Knollen, 
| Antheren, Fasern, Wuizelhaare, Stangel, Embryos, Kalli, Kotelydonen, Petiolen, Ern- 
30 tematerial, pflanzliches Gewebe, reproduktives Gewebe, Zellkulturen, die sich von der 
transgenen Pflanze abgeleiten und/oder dazu verwendet werden k6nnen, die transge- 
ne Pflanze hervorzubringen. Der Samen umfasst dabei alle Samenteile wie die Sa- 
merihullen, Epidermis- und Samenzellen, Endosperm oder Embyrogewebe. Die im 
erfindungsgemafcen Verfahren hergestellten Verbindungen konnen aber auch aus den 
35 Organismen vorteilhaft Pflanzen in Form ihrer Ole, Fett Lipide und/oder freien Fettsau- 
ren isoliert werden. Durch dieses Verfahren hergestellte mehrfach ungesattigten Fett- 
sauren lassen sich durch Ernten der Organismen entweder aus der Kultur, in der sie 
wachsen, oder vom Feld ernten. .Dies kann Ober Pressen oder Extraktion 
der Pflanzenteile bevorzugt der Pflanzensamen erfolgen. Dabei kennen die Ole, Fette, 
40 Lipide und/oder freien Fettsauren durch sogenanntes kalt schlagen oder kalt pressen 
ohne Zufuhrung von Warme durch Pressen gewonnen werden. Damit sich die Pflan- 
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zenteile speziell die Samen leichter aufschlieBen fassen, werden sie vorher zerkleinert, 
gedampft oder gerSstet Die so vorbehandelten Samen konnen anschlieBend gepresst 
werden oder mit Losungsmittel wie warmen Hexan extrahiert werden. AnschlieBend 
wird das Losungsmittel wieder entfemt. Im Falle von Mikroorganismen werden diese 
nach Ernte beispielsweise direkt ohne weitere Arbeitsschritte extrahiert oder aber nach 
Aufschluss Ober verschiedene dem Fachmann bekannte Methoden extrahiert. Auf die- 
se We.se konnen mehr als 96 % der im Verfahren hergestellten Verbindungen isoliert 
werden. AnschlieBend werden die so erhaltenen Produkte weiter bearbeitet das heiBt 
raffiniert. Dabei werden zunachst beispielsweise die Pflanzenschleime und Trubstoffe 
entfemt Die sogenannte Entschleimung kann enzymatisch oder beispielsweise che- 
misch/physikalisch durch Zugabe von Saure wie Phosphorsaure erfolgen. Anschlie- 
Bend werden die freien Fettsauren durch Behandlung mit einer Base beispielsweise 
Natronlauge entfemt Das erhaltene Produkt wird zur Entfemung der im Produkt ver- 
bliebenen Lauge mit Wasser griindlich gewaschen und getrocknet Urn die noch im 
Produkt enthaltenen Farbstoffe zu entferneri werden die Produkte einer Bleichung mit 
beispielsweise Bleicherde oder Aktivkohle unterzogen. Zum Schluss wird das Produkt 
noch beispielsweise mit Wasserdampf noch desodoriert 

Vorzugsweise sind die durch dieses Verfahren produzierten PUFAs bzw. LCPUFAs 
C18-, C20- pder Czz-FettsauremolekQIe mit mindestens zwei Doppelbindungen im Fett- 
s§uremolekQI, vorzugsweise drei, vier, fOnf oder sechs Doppelbindungen. Diese C 18 - 
Qar oder C^FettsauremolekGle lassen sich aus dem Organismus in Form eines Ols 
Lipids oder einer freien Fettsaure isolieren. Geeignete Organismen sind beispielsweise 
die vorstehend erwahnten. Bevorzugte Organismen sind transgene Pflanzen. 

Eine AusfQhrungsform der Erfindung sind deshalb Ole, Lipide oder Fettsauren oder 
Fraktionen davon, die durch das oben beschriebene Verfahren hergestellt worden sind 
besonders bevorzugt Ol, Lipid oder eine Fettsaurezusammensetzung, die PUFAs urn- ' 
fassen und von transgenen Pflanzen herrOhren. 

Eine weitere erfindungsgemSBe AusfQhrungsform ist die Verwendung des Ols Lipids 
der Fettsauren und/oder der Fettsaurezusammensetzung in Futtermitteln, Nahrungs-' 
mitteln, Kosmetika oder Pharmazeutika. 

Unter dem Begriff "Ol", "Lipid" oder "Fett" wird ein Fettsauregemisch verstanden, das 
ungesattjgte, gesattigte, vorzugsweise veresterte Fettsaure(n) enthalt Bevorzugt ist 
dass das Ol, Upid oder Fett einen hohen Anteil an mehrfach ungesattigten freien oder 
vorteilhaft veresterten Fettsaure(n), insbesondere Linolsaure, y-Linolensaure, Dihomo- 
Y-Hnolensaure, Arachidonsaure, a-Linolensaure, Stearidonsaure, Eicosatetraensaure 
Bcosapentaensaure, Docpsapentaensaure oder Docosahexaensaure hat Vorzugs- ' 
weise ist der Anteil an ungesattigten veresterten Fettsauren ungetahr 30 %, mehr be- 
vorzugt ist ein Anteil von 50 %, noch mehr bevorzugt ist ein Anteil von 60 %, 70 %, 
80 % oder mehr. Zur Bestimmung kann z.B. der Anteil an Fettsaure nach OberfOhrung 
der Fettsauren in die Methylestern durch Umesterung gaschromatographisch bestimmt 
werden. Das Ol, Lipid oder Fett kann verschiedene andere gesattigte oder ungesattigte 
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Fettsauren, z.B. Calendulasaure, Palmitin-, Palmitolein-, Stearin-, Olsaure etc enthal- 
ten. Insbesondere kann je nach Ausgangsorganismus der Anteil der verschiedenen 
Fettsauren in dem Ol oder Fett schwanken. 

Bei den im Verfahren hergestellten mehrfach ungesattigte Fettsauren mit vorteilhaft 
mindestens zwei Doppelbindungen enthalten, handelt es sich beispielsweise urn 
Sphingolipide, Phosphoglyceride, Lipide, Glycoside, Phospholipids, Monoacylglycerin 
Diacylglycenn, Triacylglycerin oder sonstige Fettsaureester. 

Aus den so im erfindungsgemaBen Verfahren hergestellten mehrfach ungesattigte 
Fettsauren mit vorteilhaft mindestens zwei Doppelbindungen lassen sich die enthalten- 
den mehrfach ungesattigten Fettsauren beispielsweise Ober eine Alkalibehandlung 
beispielsweise waBrige KOH oder NaOH oder saure Hydrolyse vorteilhaft in Gegen- 
wart eines Alkohols wie Methanol oder Ethanol oder Ober eine enzymatische Abspal- 
tung freisetzen und isolieren Ober beispielsweise Phasentrennung und anschlieBender 
Ansauerung Ober z.B. H 2 S0 4 . Die Freisetzung der Fettsauren kann auch direkt ohne 
die vorhergehend beschriebene Aufarbeitung erfolgen. 

Die im Verfahren verwendeten Nukleinsauren k6nnen nach Einbringung in einem Or- 
ganismus vorteilhaft einer Pflanzenzelle bzw. Pflanze entweder auf einem separaten 
Plasmid liegen oder in das Genom der Wirtszelle integriert sein. Bei Integration in das 
Genom kann die Integration zufallsgemaB sein oder durch derartige Rekombination 
erfolgen, dass das native Gen durch die eingebrachte Kopie ersetzt wird, wodurch die 
Produktion der gewQnschten Verbindung durch die Zelle moduliert wird, oder durch 
Verwendung eines Gens in trans, so dass das Gen mit einer funktionellen Expressi- 
onseinheit, welche mindestens eine die Expression eines Gens gewahrleistende Se- 
quenz und mindestens eine die Polyadenylierung eines funktionell transkribierten Gens 
gewahrleistende Sequenz enthalt, funktionell verbunden ist. Vorteilhaft werden die 
Nuklemsauren Ober Multiexpressionskassetten oder Konstrukte zur multiparallelen Ex- 
pression in die Organismen vorteilhaft zur multiparallelen samenspezifischen Expressi- 
on von Genen in die Pflanzen gebracht. 

Moose und Algen sind die einzigen bekannten Pflanzensysteme, die erhebliche Men- 
gen an mehrfach ungesattigten Fettsauren, wie Arachidonsaure (ARA) und/oder Eico- 
sapentaensaure (EPA) und/oder Docosahexaensaure (DHA) herstellen. Moose enthal- 
ten PUFAs in Membranlipiden wahrend Algen, algenverwandte Organismen und einige 
Pilze auch nennenswerte Mengen an PUFAs in der Triacylglycerolfraktion akkumulie- 
ren. Daher eignen sich NukleinsauremolekOle, die aus solchen Stammen isoliert wer- 
den, die PUFAs auch in der Triacylglycerolfraktion akkumulieren, besonders vorteilhaft 
fur das erfindungsgema&e Verfahren und damit zur Modifikation des Lipid- und PUFA- 
Produktionssystems in einem Wirt, insbesondere Pflanzen, wie Olfruchtpflanzen bei- 
spielsweise Raps, Canola, Lein, Hanf, Soja, Sonnenblumen, Borretsch. Sie sind'des- 
halb vorteilhaft im erfindungsgemaBen Verfahren verwendbar. 

Als Substrate der im erfindungsgemaBen Acyl-CoA:Lysophospholipid-Acyltransferasen 
werden vorteilhaft C 16 -, C 18 -, da- oder C^Fettsauren verwendet. 
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Zur Herstellung der erfindungsgemaBen langkettlger PUFAs mQssen die mehrfach 
ungesattigten de- Oder C 18 -Fettsauren zunachst durch die enzymatische Aktivitat einer 
Desaturase zunachst desaturiert und anschlieBend Ober eine Elongase urn mindestens 
zwei Kohlenstoffatome veriangert werden. Nach einer Elongationsrunde fuhrt diese 
Enzymaktivitat zu C 18 - oder C 20 -Fettsauren, und nach zwei Oder drei Elongationsrun- 
den zu Czr oder C^-Fettsauren. Die Aktivitat der erfindungsgemaBen Verfahren ver- 
wendeten Desaturasen und Elongasen fuhrt vorzugsweise zu C 18 -, Car und/oder 
Fettsauren vorteilhaft mit mindestens zwei Doppelbindungen im FettsauremolekOI vor- 
zugsweise mit drei, vier oder fiinf Doppelbindungen, besonders bevorzugt zu C20- ' 
und/oder Caa-Fettsauren mit mindestens zwei Doppelbindungen im FettsauremolekOI 
vorzugsweise mit drei, vier oder fCinf Doppelbindungen im MolekQI. Nachdem eine ers- 
te Desaturierung und die Veriangerung stattgefunden hat, konnen weitere Desaturie- 
rungsschritte wie z.B. eine solche in A-5-Posfoon erfolgen. Besonders bevorzugt als 
Produkte des erfindungsgemaBen Verfahrens sind Dihomo-v-linolensaure, Arachidon- 
saure, Eicosapentaensaure, Docosapetaensaure und/oder Docosahesaensaure. Die 
C 18: Fettsauren mit mindestens zwei Doppelbindungen in der Fettsaure kSnnen durch 
die erfindungsgemaSe enzymatische Aktivitat in Form der freien Fettsaure oder in 
Form der Ester, wie Phospholipide, Glycolipide, Sphingolipide, Phosphoglyceride, Mo- 
noacylglycerin, Diacylglycerin oder Triacylglycerin, veriangert werden. 

Der bevorzugte Biosyntheseort von Fettsauren, Olen, Lipiden oder Fette in den vorteil- 
haft verwendeten Pflanzen ist beispielsweise im allgemeinen der Samen oder Zell- 
schichten des Samens, so dass eine samenspezifische Expression der im Verfahren 
verwendeten Nukleinsauren sinnvqil ist. Es ist jedoch naheliegend, dass die Biosyn- 
these von Fettsauren, Olen oder Lipiden nicht auf das Samengewebe beschrankt sein 
muss, sondem auch in alien Qbrigen Teilen der Pflanze - beispielsweise in Epidermis- 
zellen oder in den Knollen - gewebespezifisch erfolgen kann. 

Werden im erfindungsgemaBen Verfahren als Organismen Mikroorganismus wie Hefen 
wie Saccharomyces oder Schizosaccharomyces, Pilze wie Mortierella, Aspergillus, 
Phytophtora, Entomophthora, Mucor oder Traustochytrium Algen wie Isochrysis, 
Phaeodactylum oder Crypthecodinium verwendet so werden diese Organismen vor- 
teilhaft fermentativ angezogen. 

Durch die Verwendung der erfindungsgemaBen Nukleinsauren, die fur Acyl- 
CoALysophospholipid-Acyltransferasen codieren, kdnneh im Verfahren die hergestell- 
ten mehrfach ungesattigten Fettsauren mindestens urn 10 % , bevorzugt mindestens 
urn 15 %, besonders bevorzugt mindestens urn 20 %, ganz besonders bevorzugt urn 
mindestens 50 % gegenuber dem Wildtyp der Organismen, die die Nukleinsauren nicht 
rekombinant enthalten, erh6ht werden. 

Durch das erfindungsgemaBe Verfahren kSnnen die hergestellten mehrfach ungesat- 
tigten Fettsauren in den im Verfahren verwendeten Organismen prinzipiell auf zwei 
Arten erhdht werden. Es kann vorteilhaft der Pool an freien mehrfach ungesattigten 
Fettsauren und/oder der Anteil der Ober das Verfahren hergestellten veresterten mehr- 
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fech ungesattigten Fettsauren erh6ht werden. Vorteilhaft wird durch das erfindungsge- 
maBe Verfahren der Pool an veresterten mehrfach ungesattigten Fettsauren in den' 
transgenen Organismen erh6ht. 

Werden im erfindungsgemaften Verfahren als Organismen Mikroorganismen verwen- 
det, so werden sie je nach Wirtsorganismus in dem Fachmann bekannter Weise ange- 
zogen bzw. gezQchtet. Mikroorganismen werden in der Regel in einem flQssigen Medi- 
um, das eine Kohlenstoffquelle meist in Form von Zuckem, eine Stickstoffquelle meist 
in Form von organischen Stickstoffquellen wie Hefeextrakt Oder Salzen wie Ammoni- 
umsulfat, Spurenelemente wie Eisen-, Mangan-, Magnesiumsalze und gegebenenfails 
Vitamine enthalt, bei Temperaturen zwischen 0 "C und 100 °C, bevorzugt zwischen 10 
°C bis 60 °C unter Sauerstoffbegasung angezogen. Dabei kann der pH der NahrflOs- 
sigkeit auf einen festen Wert gehalten werden, das hei&t wahrend der Anzucht reguliert 
werden Oder nichL Die Anzucht kann batch weise, semi batch weise Oder kontinuierlich 
erfolgen. Nahrstoffe konnen zu Beginn der Fermentation vorgelegt Oder semi- 
kontinuieriich Oder kontinuierlich nachgefuttert werden. Die hergestellten mehrfach un- 
gesattigten Fettsauren kSnnen nach dem Fachmann bekannten Verfahren wie oben 
beschrieben aus den Organismen isoliert werden. Beispielsweise Ober Extraktion, Des- 
tination, Kristallisation, ggf. Salzfallung und/oder Chromatographic. Die Organismen 
kQnnen dazu vomer noch vorteilhaft aufgeschlossen werden. 

Das erfindungsgemalie Verfahren wird, wenn es sich bei den Wirtsorganismen urn 
Mikroorganismen handelt, vorteilhaft bei einerTemperatur zwischen 0 °C bis 95 °C, 
bevorzugt zwischen 10 °C bis 85 °C, besonders bevorzugt zwischen 15 °C bis 75 °C, 
ganz besonders bevorzugt zwischen 15 °C bis 45 °C durchgefOhrt 

Der pH-Wert wird dabei vorteilhaft zwischen pH 4 und 12, bevorzugt zwischen pH 6 
und 9, besonders bevorzugt zwischen pH 7 und 8 gehalten. 

Das erfindungsgemalie Verfahren kann batchweise, semi-batchweise Oder kontinuier- 
lich betrieben werden. Eine Zusammenfassung uberbekannte Kultivierungsmethoden 
ist im Lehrbuch von Chmiel (Bioprozefctechnik 1. EinfQhrung in die Bioverfahrenstech- 
nik (Gustav Fischer Verlag, Stuttgart, 1991)) oder im Lehrbuch von Storhas (Bioreakto- 
ren und periphere Einrichtungen (Vleweg Verlag, Braunschweig/Wiesbaden, 1994)) zu 
finden. 

Das zu verwendende Kulturmedium hat in geeigneter Weise den Anspriichen der je- 
weiligen Stamme zu genugen. Beschreibungen von Kulturmedien verschiedener Mik- 
roorganismen sind im Handbuch "Manual of Methods for General Bacteriology" der 
American Society for Bacteriology (Washington D. O, USA, 1981) enthalten. 

Diese erfindungsgemaR einsetzbaren Medien umfassen wie oben beschrieben ge- 
wohnlich eine Oder mehrere Kohlenstoffquellen, Stickstoffquellen, anorganische Salze, 
Vitamine und/oder Spurenelemente. 
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Bevorzugte Kohlenstoffquellen sind Zucker, wie Mono-, Di- oder Polysaccharide Sehr 
gute Kohlenstoffquellen sind beispielsweise Glucose, Fructose, Mannose, Galactose 
Ribose, Sorbose, Rlbulose, Lactose, Maltose, Saccharose, Raffinose, Starke oder Cel- 
lulose. Mankann Zucker auch uber komplexe Verbindungen, wie Melassen, oder an- 
5 dare Nebenprodukte der Zucker-Rafflnierung zu den Medien geben. Es kann auch vor- 
te.lhaft sem, Gemische verschiedener Kohlenstoffquellen zuzugeben. Andere mogliche 
Kohlenstoffquellen sind Ole und Fette wie z. B. SojaSI, SonnenblumenSI, Erdnussol 
und/oder Kokosfett, Fettsauren wie z. B. Palmitinsaure, Stearinsaure und/oder Linol- 
saure, Alkohole und/oder Polyalkohole wie z. B. Glycerin, Methanol und/oder Ethanol 
1 0 und/oder organische Sauren wie z. B. Essigsaure und/oder Milchsaure. 

Stickstoffquellen sind gewdhnlich organische oder anorganische Stickstoffver- 
bindungen oder Materialien, die diese Verbindungen enthalten. Beispielhafte Stick- 
stoffquellen umfassen Ammoniak in flQssiger- oder gasform oder Ammoniumsalze, wie 
Ammoniumsulfat, Ammoniumchlorid, Ammoniumphosphat, Ammoniumcarbonat oder 
15 Ammoniumnitrat, Nitrate, Harnstoff, Aminosauren oder komplexe Stickstoffquellen wie 
Maisquellwasser, Sojamehl, Sojaprotein, Hefeextrakt, Fleischextrakt und andere. Die 
Stickstoffquellen konnen einzeln oder als Mischung verwendet werden. 

Anorganische Salzverbindungen, die in den Medien enthalten sein kdnnen, umfassen 
die Chlond-, Phosphor- oder Sulfatsalze von Calcium, Magnesium, Natrium Kobalt 
Molybdan, Kalium, Mangan, Zink, Kupfer und Eisen. 

Als Schwefelquelle fur die Herstellung von schwefelhaltigen Feinchemikalien, insbe- 
sondere von Methionin, konnen anorganische schwefelhaltige Verbindungen wie bei- 
spielsweise Sulfate, Sulfite, Dithionite, Tetrathionate, Thiosulfate, Sulfide aber auch 
organische Schwefelverbindungen, wie Mercaptane und Thiole, verwendet werden. 

Als Phosphorquelle konnen Phosphors§ure, Kaliumdihydrogenphosphat oder Dikali- 
umhydrogenphosphat oder die entsprechenden Natrium haltigen Salze verwertdet 
werden. 

Chelatbildner k6nnen zum Medium gegeben werden,. urn die Metallionen in Losung zu 
halten. Besonders geeignete Chelatbildner umfassen Dihydroxyphenole, wie Catechol 
oder Protocatechuat, oder organische S§uren, wie Citronensaure. 

Die erfindungsgemalS zur Kultivierung von Mikroorganismen eingesetzten FermentatJ- 
onsmedien enthalten Oblicherweise auch andere Wachstumsfaktoren, wie Vitamine 
oderWachstumsforderer, zu denen beispielsweise Biotin, Riboflavin, Thiamin, Folsau- 
re, Nikotinsaure, Panthothenat und Pyridoxin gehSren. Wachstumsfaktoren und Salze 
stammen haufig von komplexen Medienkomponenten, wie Hefeextrakt Melassen 
Maisquellwasser und dergleichen. Dem Kulturmedium konnen uberdies geeignete Vor- 
stufen zugesetzt werden. Die genaue Zusammensetzung der Medienverbindungen 
hangt stark vom jeweiligen Experiment ab und wird fur jeden spezifischen Fall individu- 
al entschieden. Information uber die Medienoptimierung ist erhaltlich aus dem Lehr- 
buch "Applied Microbiol. Physiology, A Practical Approach" (Hrsg. P.M. Rhodes P F 
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Stanbury, IRL Press (1997) S. 53-73, ISBN 0 19 963577 3). Wachstumsmedien lassen 
sich auch von kommerziellen Anbietem beziehen, wie Standard 1 (Merck) oder BHI 
(Brain heart infusion, DIFCO) und dergleichen. 

Samtliche Medienkomponenten werden, entweder durch Hitze (20 min bei 1 5 bar und 
121"C) oder durch Sterilfiltration, sterilisiert. Die Komponenten kannen entweder zu- 
sammen oder notigenfalls getrennt sterilisiert werden. Samtliche Medienkomponenten 
konnen zu Beginn der Anzucht zugegen sein oder wahlfrei kontinuieriich oder char- 
genweise hinzugegeben werden. 

Die Temperatur der Kultur liegt nomialerweise zwischen 15°C und 45°C, vorzugsweise 
bei 25°C bis 40°C und kann wShrend des Experimentes konstant gehalten oder veran- 
dert werden. Der pH-Wert des Mediums sollte im Bereich von 5 bis 8,5, vorzugsweise 
urn 7,0 liegen. Der pH-Wert fur die Anzucht lasst sich wahrend der Anzucht durch Zu- 
gabe von basischen Verbindungen wie Natriumhydroxid, Kaliumhydroxid, Ammoniak 
bzw. Ammoniakwasser oder sauren Verbindungen wie Phosphorsaure oder Schwefel- 
saure kontrollieren. Zur Kontrolle der Schaumentwicklung k6nneh Antischaummittel wie 
z. B. Fettsaurepolyglykolester, eingesetzt werden. Zur Aufrechterhaltung der Stabilitat 
von Plasmiden konnen dem Medium geeignete selektiv wirkende Stoffe, wie z. B Anti- 
biotika, hinzugefOgt werden. Urn aerobe Bedingungen aufrechtzuerharten, werden 
Sauerstoff oder Sauerstoff haitige Gasmischungen, wie z. B. Umgebungsluft, in die 
Kultur eingetragen. Die Temperatur der Kultur liegt normalerweise bei 20°C bis 45°C 
und vorzugsweise bei 25°C bis 40°C. Die Kultur wird solange fortgesetzt, bis sich ein 
Maximum des gewQnschten Produktes gebildet hat Dieses Ziel wird normalerweise 
innerhalb von 10 Stunden bis 160 Stunden erreicht 

Die so erhaltenen, insbesondere mehrfach ungesattigte Fettsauren enthaltenden, Fer- 
mentationsbrilhen haben Oblicherweise eine Trockenmasse von 7,5 bis 25 Gew.-%. 

Die Fermentationsbriihe kann anschlieBend weiterverarbeitet werden. Je nach Anfor- 
derung kann die Biomasse ganz oder teilweise durch Separationsmethoden, wie z. B. 
Zentrifugation, Filtration, Dekantieren oder einer Kombination dieser Methoden aus der 
Fermentationsbriihe entfernt oder vollstandig in ihr belassen werden. Vorteilhaft wird 
die Biomasse nach Abtrennung aufgearbeitet. 

Die Fermentationsbriihe kann aber auch ohne Zellabtrennung mit bekannten Metho- 
den, wiez. B. mit Hilfe eines Rotationsverdampfers, DOnnschichtverdampfers, Fallfilm- 
verdampfers, durch Umkehrosmose, oder durch Nanofiltration, eingedickt beziehungs- 
weise aufkonzentriert werden. Diese aufkonzentrierte Fermentationsbriihe kann 
schlieBlich zur Gewinnung der darin enthaltenen Fettsauren aufgearbeitet werden. 

Die im Verfahren gewonnenen Fettsauren eignen sich auch als Ausgangsmaterial fiir 
die chemische Synthese von weiteren Wertprodukten. Sie konnen beispielsweise in 
Kombination miteinander oder aliein zur Herstellung von Pharmaka, Nahrungsmittel, 
Tierfutter oder Kosmetika verwendet werden. 
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Ein weiterer erfindungsgemaBer Gegenstand sind isolierte Nukleinsauresequenzen 
d.e fur Polypept.de m.t Acyl-CoA:Lysophospholipid-Acyltransferaseaktivftat codieren 
wobe, d,e durch die Nukleinsauresequenzen codierten Acyl-CoA:Lysophospn^ ST 

5 n^h r Sen SP6 f SCh ° 16 -' C - C2 °" oder C^Fettsauren mit minders einer 
5 Doppelbmdungen im FettsauremolekQI umsetzen. 

Gmpfe^ 6 ,S0,,6rte Nuklelns§urese q ue ^en sfnd Sequenzen ausgewaM aus der 

a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, SEQ ID NO- 3 SEQ in 
NO: 5 oder SEQ ID NO: 7 dargestellten Sequenz, 

10 b) Nukleinsauresequenzen, die sich als Ergebnis des degenerierten genetischen 
Codes von der ,n SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID 
7 entnaltenden codierenden Sequenz ableiten lassen 

c) Derivate der in SEQ ID NO: 1 . SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO 
Ln a ? ^SfS ^ k,elnsaures equenz, die fur Polypeptide mit der in SEQ ID ' 

? 4 ' SEQ ,D N ° : 6 ° der SEQ ,D NO: 8 d ^^tel.ten Amino- 
^Sr n ? eren Und mindestens 4 0 % Homologie auf Aminosaureebe- 
ne mrt SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO- 8 auf 

weisen und eine Acyl-CoALysophospholipid-Acyltransferaseaktlvitat aufwei- 
s©n. 

^nf^ZT° b " 9endmten Nukte ^-equenzen aus einem eukaryon- 

rnA-Tv^f^ T7. 1"*? 6 " Nuk,elnsaures equenzen, die fOr Proteine mit Acyl- 
C_oA.Lysophospholi pi d-Acyltransferase-Aktivitat codieren oder fur Proteine des Fett- 
saure- oder L.p.dstoffwechsels, werden vorteilhaft in einer Expressionskassette (= Nuk- 

"rr" 0 "!^' ^ diS EXPreSSi0n d6r Nuk '-nsauren intern oJanTsmusvo? 
teilhaft e.ner Pflanze oder einem Mikroorganismus ermQglicht, eingebracht. 

Zum Einbringen werden die im Verfahren verwendeten Nukleinsauren vorteilhaft einer 
Amphfikat,on und Ligation in bekannter Weise unterworfen. Vorzugsweise geht man tn 
Anlehnung an das Pmtokoll der Pfu-DNA-Polymerase oder eines Pfu/Taq-DNA 
Polymerasegemisches vor. Die Primer werden in Anlehnung an die zu amplifizierende 

2 T™ 6rWeiSe S0 " ten dfe Primer s ° S^wahlt werden da7s 2s 
Amplfikat d.e gesamte kodogene Sequenz vom Start- bis zum Stop-Kodon umfasst Im 

22 2 TT?*™ ^ das -weckmaBigerweise an^SST 

sp.elswe.se kann die Analyse naoh gelelektrophoretischer Auftrennung hinsichtlich 

2E^ Q ^ lrt ^, l,n Ansch,uss kann das ***** ™* *™£L 

SnTnJnd dl p T zur VerfQ 9""9- Geeignete Klonierungsvek- 

SL£ „ cT" a " 9emeln b6kannt Hler2u 9 eh6ren ^besondere Vektoren, 
d,e ,n m.krob.ellen Systemen replizierbar sind, also vor ailem Vektoren, die eine effi 
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ziente Klonierung in Hefen Oder Piize gewahrleisten, und die stabile Transformation 
von Pflanzen ermoglichen. Zu nennen sind insbesondere verschiedene fiir die T-DNA- 
vermittelte Transformation geeignete, binare und co-integrierte Vektorsysteme. Derar- 
tige Vektorsysteme sind in der Regel dadurch gekennzeichnet, dass sie zumindest die 
5 fOr die Agrobakterium-vermrttelte Transformation benOtigten vir-Gene sowie die T-DNA 
begrenzenden Sequenzen (T-DNA-Border) beinhaiten. Vorzugsweise umfassen diese 
Vektorsysteme auch weitere cis-regulatorische Regionen wie Promotoren und Termi- 
natoren und/oder Seiektionsmarker, mit denen entsprechend transformierte Organis- 
men identifiziert werden konnen. Wahrend bei co-integrierten Vektorsystemen vir-Gene 

10 und T-DNA-Sequenzen auf demselben Vektor angeordnet sind, basieren binare Sys- 
teme auf wenigstens zwei Vektoren, von denen einer vir-Gene, aber keine T-DNA und 
ein zweiter T-DNA jedoch kein vir-Gen tragi Dadurch sind letztere Vektoren relativ 
klein, leicht zu manipulieren und sowohl in E.-coli als auch in Agrobacterium zu repli- 
zieren. Zu diesen binaren Vektoren gehoren Vektoren derSerien pBIB-HYG, pPZP, 

15 pBecks, pGreen. ErfindungsgemaS bevorzugt verwendet werden Bin19, pBI101, pBi- 

• nAR, pGPTV und pCAMBIA. Eine Obersicht Ober binare Vektoren und ihre Verwen- 
dung gibt Heilens et al. Trends in Plant Science (2000) 5, 446-451. FOr die Vektorpra- 
paration konnen die Vektoren zunachst mit Restriktionsendonuklease(n) linearisiert 
und dann in geeigneter Weise enzymatisch modifiziert werden. Im Anschluss wird der 
20 Vektor gereinigt und ein Aliquot fOr die Klonierung eingesetzt. Bei der Klonierung wird 
das enzymatisch geschnittenen und erforderlichenfalls gereinigten Amplifikat mit ahn- 
lich praparierten Vektorfragmenten mit Einsatz von Ligase kloniert Dabei kann ein 
bestimmtes Nukleinsaurekonstrukt bzw. Vektor- Oder Plasmidkonstrukt einen Oder 
auch mehrere kodogene Genabschnitte aufweisen. Vorzugsweise sind die kodogenen 
25 Genabschnitte in diesen Konstrukten mit regulatorischen Sequenzen funktional ver- 
knflpft Zu den regulatorischen Sequenzen gehSren insbesondere pflanzliche Sequen- 
zen wie die oben beschriebenen Promotoren und Terminatoren. Die Konstrukte lassen 
sich vorteilhafterweise in Mikroorganismen, insbesondere Escherichia coli und Agro- 
bacterium tumefaciens, unter selektiven Bedingungen stabil propagieren und ermogli- 
30 chen einen Transfer von heterologer DNA in Pflanzen Oder Mikroorganismen. 

• Unter der vorteilhaften Verwendung von Klonierungsvektoren konnen die im Verfahren 
verwendeten Nukleinsauren, die erfinderischen Nukleinsauren und Nukleinsaure- 
konstrukte in Organismen wie Mikroorganismen Oder vorteilhaft Pflanzen eingebracht 
werden und damit bei der Pflanzentransformation verwendet werden, wie denjenigen, 
35 die veroffentlicht sind in und dort zitiert sind: Plant Molecular Biology 

and Biotechnology (CRC Press, Boca Raton, Florida), Kapitel 6/7, S. 71-119 (1993); 
F.F. White, Vectors for Gene Transfer in Higher Plants; in: Transgenic Plants, Bd. 1, 
Engineering and Utilization, Hrsgb.: Kung und R. Wu, Academic Press, 1993,' 15-38; 
B. Jenes et a!., Techniques for Gene Transfer, in: Transgenic Plants, Bd. 1, Enginee- 
40 ring and Utilization, Hrsgb.: Kung und R. Wu, Academic Press (1993), 128-143; Potry- 
kus, Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991), 205-225)). Die im Verfah- 
ren verwendeten Nukleinsauren, die erfinderischen Nukleinsauren und Nukleinsaure- 
konstrukte und/oder Vektoren lassen sich damit zur gentechnologischen Veranderung 
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eines breiten Spektrums an Organismen vorteilhaft an Pflanzen verwenden, so class 
diese bessere und/oder effizientere Produzenten von PUFAs werden. 

Es gibt eine Reihe von Mechanismen, durch die die Veranderung eines erfindungsge- 
mafien Acyl-CoArLysophospholipid-Acyltransferase-Proteins die Ausbeute, Produktion 

5 und/oder Effizienz der Produktion einer Feinchemikalie aus einer Olfruchtpflanze Oder 
einem Mikroorgan.smus aufgrund eines veranderten Proteins direkt beeinflussen kann 
Die .Anzahl oder AMMtflt des Acyl-CoALysophospholipid-Acyltransferase-Proteins 
Oder -Gens sowie von Genkombinationen von Acyl-CoA:L.ysophospholipid- 
Acyltransferasen, Desaturasen und/oder Elongasen kann erhoht sein, so dass grdliere 

10 Mengen der produzierten Verbindungen de novo hergestellt werden, weil den Orga- 
msmen diese Aktivitat und Fahigkeitzur Biosynthese vor dem Einbringen des/der ent- 
sprechenden Gens/Gene fehlte. Entsprechendes gilt fQr die Kombination mit weiteren 
Desaturasen oder Elongasen Oder weiteren Enzymen aus dem Fettsaure- und Li- 
pidstoffwechsel. Auch die Verwendung verschiedener divergenter, d h auf DNA- 

5 Sequenzebene unterschiedlicher Sequenzen kann dabei vorteilhaft sein bzw die Ver- 
wendung von Promotoren zur Genexpression, die eine andere zeitliche Genexpression 
z.B. abhangig vom Reifegrad eines Samens oder Ol-speichemden Gewebes ermog- 
licht. y 

Durch das Einbringen eines Acyl-CoA:Lysophosphol«pid-Acyltransferase-, Desaturase- 
und/oder Elongase-Gens oder mehrerer Acyl-CoALysophospholipid-Acyltransferasen- 
Desaturase- und/oder Elongase-Gene in einen Organismus allein oder in Kombination ' 
mit anderen Genen in eine Zelle kann nicht nur den Biosynthesefluss zum Endprodukt 
erhoht, sondern auch die entsprechende Triacylglycerin-Zusammensetzung erhaht 
oder de novo geschaffen werden. Ebenso kann die Anzahl oder Aktivitat anderer Ge- 
ne die am Import von Nahrstoffen, die zur Biosynthese einer oder mehrerer Feinche- 
mikalien (z.B. Fettsauren, polaren und neutralen Lipiden) notig sind, erhoht sein so 
dass die Konzentration dieser Vonaufer, Cofaktoren oder Zwischenverbindungen in- 
nerhalb der Zellen oder innerhalb des Speicherkompartiments erhoht ist, wodurch die 
Fahigkeit der Zellen zur Produktion von PUFAs, wie im folgenden beschrieben weiter 
gestagen wird. Fettsauren und Lipide sind selbst als Feinchemikalien wGnschenswert 
durch Optimierung der Aktivitat oder Erhohung der Anzahl einer oder mehrerer Acyl- ' 
CoA:Lysophospholipid-Acyltransferase-, Desaturasen und/oder Elongasen die an der 
B.osynthese dieser Verbindungen beteiligt sind, oder durch ZerstSren der Aktivitat ei- 
ner oder mehrerer Desaturasen, die am Abbau dieser Verbindungen beteiligt sind 
kann es mSglich sein, die Ausbeute, Produktion und/oder Effizienz der Produktion* von 
Fettsaure- und LipidmolekOlen aus Organismen und vorteilhaft aus Pflanzen zu stei- 
gem. 

Die im erfindungsgemaBen Verfahren verwendeten isolierten Nukleinsauremolekule 
codieren fiir Proteine oder Telle von diesen, wobei die Proteine oder das einzelne Pro- 
tein oder Telle davon eine Aminosauresequenz enthalt, die ausreichend homolog 
zu einer Aminosauresequenz der Sequenz SEQ ID NO: 2, SEQ ID NO* 4 SEQ ID NO- 
6 oder SEQ ID NO: 8 ist, so dass das Protein oder der Teil davon eine Acyl- 
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CoA:Lysophospholipid-Acyltransferase-Alctivitit beibehalt. Vorzugsweise hat das Pro- 
tein Oder der Teil davon, das/der von dem Nukleinsauremolekul kodiert wird noch sei- 
ne wesentliche enzymatische Aktivitat und die Fahigkeit, am Stoffwechsel von zum 
Aufbau von Zellmembranen Oder LipidkSrperchen in Organismen vorteilhaft in Pflanzen 
notwendigen Verbindungen Oder am Transport von MolekQIen Qber diese Membranen 
teilzunehmen noch hat. Vorteilhaft ist das von den NukleinsauremolekOlen kodierte 
Protein zu mindestens etwa 40 %, vorzugsweise mindestens etwa 60 % und starker 
bevorzugt mindestens etwa 70 %, 80 % Oder 90 % und am starksten bevorzugt min- 
destens etwa 95 %, 96 %, 97 %, 98 %, 99 % Oder mehr homolog zu einer Aminosau- 
resequenz der Sequenz SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 Oder SEQ ID 
NO: 8. Vorteilhafte AusfQhrungsformen der erfindungsgemafcen Aminosauresequenz 
der Sequenz SEQ ID NO: 2 sind Aminosauresequenzen, die an Position 30 der SEQ 
ID NO: 2 anstelle des vorhandenen Methionin einen Valinrest haben Oder in Position 
100 anstelle des vorhandenen Serin einen Glycinrest haben Oder in Position 170 an- 
stelle des vorhandenen Phenyialanin einen Serinrest haben. Diese werden in SEQ ID 
NO: 4, SEQ ID NO: 6 bzw. SEQ ID NO: 8 wiedergegeben. Im Sinne der Erfindung ist 
unter Homologie Oder homolog, Identitat Oder identisch zu verstehen. 

Unter wesentlicher enzymatischer Aktivitat der verwendeten Acyl-CoA:Lysophospho- 
hpid-Acyltransferasen ist zu verstehen, dass sie gegenQber den durch die Sequenz mit 
SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 Oder SEQ ID NO: 7 und deren Derivate 
codierten Proteinen/Enzymen im Vergleich noch mindestens eine enzymatische Aktivi- 
tat von mindestens 1 0 %, bevorzugt 20 %, besonders bevorzugt 30 % und ganz be- 
sonders 40 % aufweisen und damit am Stoffwechsel von zum Aufbau von Fettsauren 
in einem Organismus vorteilhaft einer Pflanzenzelle notwendigen Verbindungen Oder 
am Transport von MolekQIen Ober Membranen teilnehmen konnen, wobei desaturierte 
C16-, C18- Oder C20-24-Kohlenstoffketten mit Doppelbindungen an mindestens zwei 
vorteilhaft drei, vier oder funf Stellen gemeint ist. 

Vorteilhaft im Verfahren verwendbare Nukleinsauren stammen aus Pilzen oder Pflan- 
zen wie Algen oder Moosen wie den Gattungen Physcomitrella, Thraustochytrium 
Phytophtora, Ceratodon, Isochrysis, Aleurita, Muscarioides, Mortierella, Borago, 
Phaeodactylum, Crypthecodinium oder aus Nematoden wie Caenorhabditis, speziell 
aus den Gattungen und Arten Physcomitrella patens, Phytophtora infestans, Ceratodon 
purpureus, Isochrysis galbana, Aleurita farinosa, Muscarioides viallii, Mortierella alpina 
Borago officinalis, Phaeodactylum tricornutum oder besonders vorteilhaft aus Cae- 
norhabditis elegans. 

Alternativ k6nnen die verwendeten isolierten Nukleotidsequenzen fiir Acyl- 
CoALysophospholipid-Acyltransferasen codieren, die an eine Nukleotidsequenz der 
SEQ ID NO: 1 , SEQ ID NO: 3. SEQ ID NO: 5 oder SEQ ID NO: 7 hybridisieren z B 
unter stringenten Bedingungen hybridisieren. 
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Die im Verfahren verwendeten Nukleinsauresequenzen werden vorteilhaft in einer Ex- 
pressionskassette, die die Expression der Nukleinsauren in Organismen wie Mikroor- 
ganismen oder Pflanzen ermeglicht, eingebracht 

Dabei werden die fQr die erfinderische Acyl-CoA:Lysophospholipid-Acyltransferasen 
die verwendeten Desaturasen und/oder die Elongasen codierenden Nukleinsauresel 
quenzen mit einem Oder mehreren Regulationssignalen vorteilhafterweise zur Erhe- 
hung der Genexpression funktionell verknupft Diese regulatorischen Sequenzen sollen 
die gezielte Expression der Gene und der Proteinexpression ermoglichen. Dies kann 
beispielsweise je nach Wirtsorganismus bedeuten, dass das Gen erst nach Induktion 
exprimiert und/oder Qberexprimiert wird, oder dass es sofort exprimiert und/oder Qbe- 
rexprimiert wird. Beispielsweise handelt es sich bei diesen regulatorischen Sequenzen 
um Sequenzen an die Induktoren oder Repressoren binden und so die Expression der 
Nukleinsaure regulieren. Zusatzlich zu diesen neuen Regulationssequenzen oder an- 
stelle dieser Sequenzen kann die naturliche Regulation dieser Sequenzen vor den ei- 
gentlichen Strukturgenen noch vorhanden sein und gegebenenfalls genetisch veran- 
dert worden sein, so dass die natiirliche Regulation ausgeschaltet und die Expression 
der Gene erhoht wurde. Die Expressionskassette (= Expressionskonstrukt = Gen- 
konstrukt) kann aber auch einfacher aufgebaut sein, das heiftt es wurden keine zusatz- 
lichen Regulationssignale vor die Nukleinsauresequenz oder dessen Derivate inseriert 
und der naturliche Promotor mit seiner Regulation wurde nicht entfernt. Stattdessen 
wurde die natiiriiche Regulationssequenz so mutiert, dass keine Regulation mehr er- 
folgt und/oder die Genexpression gesteigert wird. Diese veranderten Promotoren kon- 
nen in Form von Teilsequenzen (= Promotor mit Teilen der erfindungsgemalJen Nuk- 
leinsauresequenzen) auch allein vor das naturliche Gen zur Steigerung der Aktivitat 
gebracht werden. Das Genkonstrukt kann auBerdem vorteilhafterweise auch eine oder 
mehrere sogenannte "enhancer Sequenzen" funktionell verknupft mit dem Promotor 
enthalten, die eine erhohte Expression der Nukleinsauresequenz ermSglichen. Auch 
am 3*-Ende der DNA-Sequenzen konnen zusatzliche vorteilhafte Sequenzen inseriert 
werden wie weitere regulatorische Elemente oder Terminatoren. Die Acyl- 
CoA:Lysophospholipid-Acyltransferase-Gene sowie die vorteilhaft verwendeten A-4- 
Desaturase-, A5-Desaturase-, A-6-Desaturase- und/oder A-8-Desaturase-Gene 
und/oder die A-5-Elongase-, A-6-Elongase- und/qder A-9-Eiongase-Gene konnen in 
einer oder mehreren Kopien in der Expressionskassette (= Genkonstrukt) enthalten 
sein. Vorteilhaft liegt nur jeweils eine Kopie der Gene in der Expressionskassette vor 
Dieses Genkonstrukt oder die Genkonstrukte konnen zusammen im Wirtsorganismus 
expnmiert werden. Dabei kann das Genkonstrukt oder die Genkonstrukte in einem - 
oder mehreren Vektoren inseriert sein und frei in der Zelle vorliegen oder aber im Ge- 
nom inseriert sein. Es ist vorteilhaft fur die Insertion weiterer Gene im Wirtsgenom, 
wenn die zu exprimierenden Gene zusammen in einem Genkonstrukt vorliegen. 

Die regulatorischen Sequenzen bzw. Faktoren kennen dabei wie oben beschrieben 
vorzugsweise die Genexpression der eingefQhrten Gene positiv beeinflussen und da- 
durch erhohen. So kann eine Verstarkung der regulatorischen Elemente vorteilhafter- 
weise auf der Transkriptionsebene erfolgen, indem starke Transkriptionssignale wie 
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Promotoren und/oder "Enhancer verwendet werden. Daneben ist aber auch eine Ver- 
starkung der Translation moglich, indem beispielsweise die Stabilitat der mRNA ver- 
bessert wind. 



BnewertereAusfQhrungsform der Erfindung sind ein oder mehrere Genkonstrukte die 
eine Oder mehrere Sequenzen enthalten, die durch SEQ ID NO: 1, SEQ ID NO- 3 SEQ 

a ISjTnfS ,D 7 ° der d6SSen DeriVate deflniert sind und «* Polypeptide 
gemaS SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 Oder SEQ ID NO: 8 kodieren. Die 

genannten Acyl-CoA:Lysophospholipid-Acyltransferasen fOhren dabei zu einem Aus- 

tausch der Fettsauren zwischen dem Mono-, Di- und/oder Triglyceridpool der Zelle und 

dem CoA-Fettsaureester-Pool, wobei das Substrat vorteilhaft ein, zwei, drei, vier oder 

funf Doppelbindungen aufweist und vorteilhaft 16. 18, 20, 22 oder 24 Kohlenstoffatome 

im FetteauremolekQI aufweist Gleiches gilt fur ihre Homologen, Derivate oder Analoga 

die funkbonsfahig mit einem oder mehreren Regulationssignalen, vorteilhafterweise zur 

Steigerung der Genexpression, verbunden sind. 

Vorteilhafte Regulationssequenzen for das neue Verfahren liegen beispielsweise in 
Promotoren vor, wie dem cos-, tac-, trp-, tet-, trp-teH Ipp-, lac-, Ipp-lac-, lack,-, T7- 
' T5 ~! T3 ~' 9aK ^ ara ~ SP6 -> A " PR - od er A-PL-Promotor und werden vorteilhaft- 
erwe.se n Gram-negativen Bakterien angewendet. Weitere vorteilhafte Regulationsse- 
quenzen Legen beispielsweise in den Gram-positiyen Promotoren amy und SP02 in 
den Hefe- oderPilzpromotoren ADC1. MFa. AC. P-60. CYC1, GAPDH TEF rp28 
ADH oder in den Pfianzenpromotoren CaMV/35S [Franck et al., Cell 21 (1980) 285- 
294]. PRP1 [Ward et al.. Plant. Mol. Biol. 22 (1993)], SSU. OCS. Iib4, usp, STLS1 

!oIr» ft 0de H m K Ub J^ Phaseolin-Promotor vor. In diesem Zusammenhang 
vorteilhaft sind ebenfalls mduzierbare Promotoren, wie die in EP-A-0 388 186 (Ben- 
zylsulfonamid-induzierbar). Plant J. 2. 1992:397-404 (Gatz et al.. Tetracyclin- 
induzierbar). EP-A-0 335 528 (Abzisjnsaure-induzierbar) oder WO 93/21334 (Ethanol- 
oder Cyclohexenol-induzierbar) beschriebenen Promotoren. Weitere geeignete Pfian- 
zenpromotoren sind der Promotor von cytosolischer FBPase oder der ST-LSI-Promotor 
der Kartoffel (Stockhaus et al., EMBO J. 8, 1989, 2445), der Phosphoribosylpy- 
^^^^^^^omotor aus Glycine max (Genbank-Zugangsnr 
U87999) oder der in EP-A-0 249 676 beschriebene nodienspezifische Promotor Be- 
sonders vorteHhafte Promotoren sind Promotoren, welche die Expression in Geweben 
ermoglichen, die an der Fettsaurebiosynthese beteiligt sind. Ganz besonders vorteilhaft 
sind I samenspezifische Promotoren, wie der ausfQhrungsgemaSe USP Promotor aber 
auch andere Promotoren wie der LeB4-, DCS. Phaseolin- oder Napin-Promotor. Weite- 
re besonders vorteilhafte Promotoren sind samenspezifische Promotoren, die fur mo- 
nokotyle oder dikotyle Pflanzen verwendet werden konnen und in US 5 608 152 (Na- 
pin-Promotor aus Raps). WO 98/45461 (Oleosin-Promotor aus Arobidopsis) US 
5,504,200 (Phaseolin-Promotor aus Phaseolus vulgaris), WO 91/13980 (Bce4- 
Promotor aus Brassica), von Baeumlein et al., Plant J., 2. 2. 1992:233-239 (LeB4- 
Promotor aus einer Leguminose) beschrieben sind. wobei sich diese Promotoren fUr 
D.kotyledonen eignen. Die folgenden Promotoren eignen sich beispielsweise fQr Mono- 
kotyledonen lpt-2- oder lpt-1 -Promotor aus Gerste (WO 95/1 5389 und 
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WO 95/23230), Hordein-Promotor aus Gerste und andere, in WO 99/16890 beschrie- 
bene geeignete Promotoren. 

Es ist im Prinzip m8glich, alle naturlichen Promotoren mit ihren Regulationssequenzen 
wie die oben genannten, fflr das neue Verfahren zu verwenden. Es ist ebenfalls m6g- ' 
lich und vorteilhaft, zusatzlich oder alleine synthetische Promotoren zu verwenden 
besonders wenn sie eine Samen-spezifische Expression vermitteln, wie z.B. beschrie- 
ben in WO 99/16890. 

Urn einen besonders hohen Gehalt an PUFAs vor allem in transgenen Pflanzen zu 
erzielen, sollten die PUFA-Biosynthesegene vorteilhaft samenspezifisch in Olsaaten 
exprimiert werden. Hierzu konnen Samen-spezifische Promotoren verwendet werden 
bzw. solche Promotoren die im Embryo und/oder im Endosperm aktiv sind. Samen- 
spezifische Promotoren kfinnen prinzipiell sowohl aus dikotolydonen als auch aus mo- 
nokotolydonen Pflanzen isoliert werden. Imfolgenden sind vorteilhafte bevorzugte 
Promotoren aufgefuhrt USP (= unknown seed protein) und Vicilin (vlcia faba) [Baum- 
lein etal., Mol. Gen Genet, 1991, 225(3)], Napin (Raps) [US 5,608,152], Acyl-Carrier 
Protein (Raps) [US 5,315,001 und WO 92/18634], Oleosin (Arabidopsis thaliana) [WO 
98/45461 und WO 93/20216], Phaseolin (Phaseolus vulgaris) [US 5,504,200], Bce4 
[WO 91/13980], Leguminosen B4 (LegB4-Promotor) [Baumlein et al., Plant J 2 2 
1992], Lpt2 und Ipt1 (Gerste) [WO 95/15389 u. WO95/23230], Samen-spezifische Pro- 
motoren aus Reis, Mais u. Weizen [WO 99/16890], Amy32b, Amy 6-6 und Aleurain [US 
5,677,474], Bce4 (Raps) [US 5,530,149], Glycinin (Soja) [EP 571 741], Phosphoenol- 
Pyruvatcarboxylase (Soja) [JP 06/62870], ADR12-2 (Soja) [WO 98/08962], Isocitratlya- 
se (Raps) [US 5,689,040] Oder a-Amylase (Gerste) [EP 781 849]. 

Die Pflanzengenexpression lasstsich auch Qber einen chemisch induzierbaren Promo- 
tor erieichtern (siehe eine Obersicht in Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. 
Biol., 48:89-108). Chemisch induzierbare Promotoren eignen sich besonders, wenn 
gewOnscht wird, dass die Genexpression auf zeitspezifische Weise erfolgt. Beispiele 
fur solche Promotoren sind ein Salicylsaure-induzierbarer Promotor (WO 95/19443), 
ein Tetracyclin-induzierbarer Promotor (Gatz et al. (1992) Plant J. 2, 397-404) und ein 
Ethanol-induzierbarer Promotor. 

Urn eine stabile Integration der Biosynthesegene in die transgene Pflanze Ober mehre- 
re Generation sicherzustellen, sollte jede der im Verfahren verwendeten Nukleinsau- 
ren, die fflr die Acyl-CoA:Lysophospholipid-Acyltransferase, die vorteilhafte A-4- 
Desaturase, die A-5-Desaturase, die A-6-Desaturase, die A-8-Desaturase und/oder die 
A-5-Elongase, die A-6-Elongase und/oder die A-9-Elongase codieren, unter der Kon- 
trolle eines eigenen bevorzugt eines unterschiedlichen Promotors exprimiert werden, 
da sich wiederholende Sequenzmotive zu Instability der T-DNA bzw. zu Rekombinati- 
onsereignissen fOhren kfinnen. Die Expressionskassette ist dabei vorteilhaft so aufge- 
baut, dass einem Promotor eine geeignete Schnittstelle zur Insertion derzu expremier- 
enden Nukleinsaure folgt vorteilhaft in einem Polylinker anschlieBend gegebenenfalls 
ein Terminator hinter dem Polylinker liegt. Diese Abfolge wiederholt sich mehrfach be- 
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vorzugt dreh vier- Oder funfmal, so dass bis zu funf Gene In einem Konstrukt zusam- 
mengefuhrt werden und so zur Expression in die transgene Pflanze eingebracht wer- 
den konnen. Vorteilhaft wiederholt sich die Abfolge bis zu dreimal. Die Nukleinsaure- 
sequenzen werden zur Expression Ober die geeignete Schnittstelle beispielsweise im 
Polyl.nkerh.nter den Promotor inseriert. Vorteilhaft hat jede Nukleinsauresequenz ihren 
eigener. Promotor und gegebenenfalls ihren eigenen Terminator. Es ist aber auch 
moglich mehrere Nukleinsauresequenzen hinter einem Promotor und ggf. vor einem 
Terminator zu inserieren. Dabei ist die Insertionsstelle bzw. die Abfolge der inserierten 
Nuklemsauren in der Expressionskassette nicht von entscheidender Bedeutung das 
he«ftt erne Nukleinsauresequenz kann an erster Oder letzter Stelle in der Kassette inse- 
riert sein, ohne dass dadurch die Expression wesentlich beeinflusst wird. Es konnen in 
der Expressionskassette vorteilhaft unterschiedliche Promotoren wie beispielsweise 
der USP-, LegB4 oder DC3-Promotor und unterschiedliche Terminatoren verwendet 
werden. Es ist aber auch mSglich nur einen Promotortyp in der Kassette zu verwenden 
Dies kann jedoch zu unerwOnschten Rekombinationsereignissen fuhren. 

Wie oben beschrieben sollte die Transkription der eingebrachten Gene vorteilhaft 
durch geeignete Terminatoren am 3'-Ende der eingebrachten Biosynthesegene (hinter 
dem Stoppcodon) abgebrochen werden. Verwendet werden kann hierz.B. derOCSI 
Term.nator. Wie auch fur die Promotoren, so sollten hierfur jedes Gen unterschiedliche 
Terminatorsequenzen verwendet werden. 

Das Genkonstrukt kann, wie oben beschrieben, auch weitere Gene umfassen die in 
die Organismen eingebracht werden sollen. Es ist rndglich und vorteilhaft, in die Wirts- 
organismen Regulationsgene, wie Gene fur Induktoren, Repressoren oder Enzyme 
welche durch ihre Enzymaktivitat in die Regulation eines oder mehrerer Gene eines' 
Biosynthesewegs eingreifen, einzubringen und darin zu exprimieren. Diese Gene kon- 
nen heterologen oder homologen Ursprungs sein. Weiterhin konnen vorteilhaft im Nuk- 
lemsaurekonstrukt bzw. Genkonstrukt wertere Biosynthesegene des Fettsaure- oder 
Lip.dstoffwechsels enthaiten sein oder aber diese Gene konnen auf einem weiteren 
oder mehreren weiteren Nukleinsaurekonstrukten liegen. Vorteilhaft werden als Bio- 
synthesegene des Fettsaure- oder Lipidstoffwechsels ein Gen ausgewahlt aus 
der Gruppe Acyl-QoA-Dehydrogenase(n), Acyl-ACP[= acyl carrier protein]- 
Desaturase(n), Acyl-ACP-Thioesterase(n), Fettsaure-Acyl-Transferase(n), Fettsaure- 
Synthase(n), Fettsaure-Hydroxylase(n), Acetyl-Coenzym A-Carboxylase(n) Acyl- 
Coenzym A-Oxidase(n), Fettsaure-Desaturase(n), Fettsaure-Acetylenasen' Lipoxy- 
genasen, Triacylglycerol-Upasen, Allenoxid-Synthasen, Hydroperoxid-Lyasen oder 
Fettsaure-Elongase(n) oder deren Kombinationen verwendet. Besonders vorteilhafte 
Nukleinsauresequenzen sind Biosynthesegene des Fettsaure- oder Lipidstoffwechsels 
ausgewahlt aus der Gruppe der A-4-Desaturase-, A-5-Desaturase-, A-6-Desaturase- 
A-8-Desatuase-, A-9-Desaturase-, A-12-Desaturase-, A-5-Elongase-, A-6-Bongase- ' 
oder A-9-Elongase. 
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Dabei kdnnen die vorgenannten Desaturasen in Kombination mit anderen Elongasen 
und Desaturasen in erfindungsgemaSen Expressionskassetten kloniert werden und zur 
Transformation von Pflanzen mithiife von Agrobakterium eingesetzt werden. 

Die regulatorischen Sequenzen bzw. Faktoren kfinnen dabei wie oben beschrieben 
vorzugsweise die Genexpression der eingefQhrten Gene positiv beeinflussen und da- 
durch erhShen. So kann eine Verstarkung der regulatorischen Elemente vorteilhafter- 
weise auf der Transkriptionsebene erfolgen, indem starke Transkriptionssignale wie 
Promotoren und/oder "Enhancer* verwendet werden. Daneben ist aber auch eine Ver- 
starkung der Translation mSglich, indem beispielsweise die Stabilitat der mRNA ver- 
bessertwird. Die Expressionskassetten kdnnen prinzipiell direktzum Einbringen in die 
Pflanze verwendet werden Oder aber in einen Vektoren eingebracht werden. 

Diese vorteilhaften Vektoren, vorzugsweise Expressionsvektoren, enthaiten die im Ver- 
fahren verwendeten Nukleinsauren, die for Acyl-CoA:Lysophospholipid- 
Acyltransferasen codieren, oder ein Nukleinsaurekonstrukt, die die verwendeten Nuk- 
leinsaure allein oder in Kombination mit weiteren Biosynthesegenen des Fettsaure- 
oder Lipidstoffwechsels wie A-4-Desaturase-, A-5-Desaturase-, A-6-Desaturase- A-8- 
Desatuase-, A-9-Desaturase-, A-12-Desaturase-, A-5-Elongase-, A-6-Elongase- ' 
und/oder A-9-Elongase. Wie hier verwendet, betrifft der Begriff "Vektor" ein Nukleinsau- 
remolekul, das eine andere Nukleinsaure transportieren kann, an welche es gebunden 
ist. Ein Vektortyp ist ein "Plasmid", was fur eine zirkulare doppeistrangige DNA-Schleife 
steht, in die zusatzlichen DNA-Segmente ligiert werden k5nnen. Ein we'rterer Vektortyp 
ist ein viraler Vektor, wobei zusatzliche DNA-Segmente in das virale Genom ligiert 
werden kdnnen. Bestimmte Vektoren konnen in einer Wirtszelle, in die sie eingebracht 
worden sind, autonom replizieren (z.B. Bakterienvektoren mit bakteriellem Replikation- 
sursprung). Andere Vektoren werden vorteilhaft beim Einbringen in die Wirtszelle in 
das Genom einer Wirtszelle integriert und dadurch zusammen mit dem Wirtsgenom 
repliziert. Zudem konnen bestimmte Vektoren die Expression von Genen, mit denen 
sie funktionsfahig verbunden sind, steuem. Diese Vektoren werden hier als "Expressi- 
onsvektoren" bezeichnet. GewShnlich haben Expressionsvektoren, die fur DNA- 
Rekombinationstechniken geeignet sind, die Form von Plasmiden. In der vorliegenden 
Beschreibung kfinnen "Plasmid" und "Vektor" austauschbar verwendet werden, da 
das Plasmid die am haufigsten verwendete Vektorform ist Die Erfindung soli jedoch 
diese anderen Expressionsvektorformen, wie virale Vektoren, die ahnliche Funktionen 
ausQben, umfassen. Femer soil der Begriff Vektor auch andere Vektoren, die dem 
Fachmann bekannt sind, wie Phagen, Viren, wie SV40, CMV, TMV, Transposons, IS- 
Elemente, Phasmide, Phagemide, Cosmide, lineare oder zirkulare DNA, umfassen. 

Die im Verfahren vorteilhaft verwendeten rekombinanten Expressionsvektoren umfas- 
sen die die unten beschriebenen Nukleinsauren oder das oben beschriebene Gen- 
konstrukt in einer Form, die sich zur Expression der verwendeten Nukleinsauren in 
einer Wirtszelle eignen, was bedeutet, dass die rekombinanten Expressionsvektoren 
eine oder mehrere Regulationssequenzen, ausgewahlt auf der Basis der zur Expressi- 
on zu verwendenden Wirtszellen, die mit der zu exprimierenden Nukleinsauresequenz 
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funktionsfahig verbunden ist, umfasst In einem rekombinanten Expressionsvektor be- 
deutet "funktionsfahig verbunden", dass die Nukleotidsequenz von Interesse derart an 
die ReguIationssequenz(en) gebunden ist, dass die Expression der Nukleotidsequenz 
mdglich ist und sie aneinander gebunden sind, so dass beide Sequenzen die vorher- 
gesagte, der Sequenz zugeschriebene Funktion erfUllen (z.B. in einem In-vitro- 
Transkriptions-/Translationssystem Oder in einer Wirtszelle, wenn der Vektor in die 
Wirtszelle eingebracht wird). Der Begriff "Regulationssequenz" soil Promotoren, En- 
hancer und andere Expressionskontrollelemente (z.B. Polyadenylierungssignale) um- 
fassen. Diese Regulationssequenzen sind z.B. beschrieben in Goeddel: Gene Expres- 
sion Technology: Methods in Enzymology 185, Academic Press, San Diego, CA 
(1990), Oder siehe: Gruber und Crosby, in: Methods in Plant Molecular Biology and 
Biotechnolgy, CRC Press, Boca Raton, Florida, Hrsgb.: Glick und Thompson, Kapitel 7, 
89-108, einschlieSlich der Literaturstellen darin. Regulationssequenzen umfassen sol- 
che, welche die konstitutive Expression einer Nukleotidsequenz in vielen Wirtszelltypen 
steuem, und solche, welche die direkte Expression der Nukleotidsequenz nur in be- 
stimmten Wirtszellen unter bestimmten Bedingungen steuem. Der Fachmann weiR, 
dass die Gestaltung des Expressionsvektors von Faktoren, wie der Auswahl der zu 
transformierenden Wirtszelle, dem AusmaS der Expression des gewunschten Proteins 
usw., abhangen kann. 

Die verwendeten rekombinanten Expressionsvektoren konnen zur Expression von A- 
cyl-CoA:Lysophospholipid-Acyltransferasen, Desaturasen und Elongasen in prokaryo- 
tischen oder eukaryotischen Zellen gestaltet sein. Dies ist vorteilhaft, da haufig Zwi- 
schenschritte der Vektorkonstruktion der Einfachheithalber in Mikroorganismen durch- 
gefiihrt werden. Beispielsweise konnen Acyl-CoA:Lysophospholipid-Acyltransferase-, 
Desaturase- und/oder Elongase-Gene in bakteriellen Zellen, Insektenzellen (unter 
Verwendung von Baculovirus-Expressionsvektoren), Hefe- und anderen Pilzzellen 
(siehe Romanos, MA., et al. (1992) "Foreign gene expression in yeast: a review- 
Yeast 8:423-488; van den Hondel, C.A.M.J.J., etal. (1991) "Heterologous gene ex- 
pression in filamentous fungi", in: More Gene Manipulations in Fungi, J.W. Bennet & 
L.L. Lasure, Hrsgb., S. 396-428: Academic Press: San Diego; und van den Hondel, 
C.AM.J.J., & Punt, P.J. (1991) "Gene transfer systems and vector development for 
filamentous fungi, in: Applied Molecular Genetics of Fungi, Peberdy, J.F., et al., Hrsgb., 
S. 1-28, Cambridge University Press: Cambridge), Algen (Falciatore et al., 1999, Ma- " 
rine Biotechnology. 1, 3:239-251), Ciliaten derTypen: Holotrichia, Peritrichia, Spirotri- 
chia, Suctoria, Tetrahymena, Paramecium, Colpidium, Glaucoma, Platyophrya, Poto- 
macus, Desaturaseudocohnilembus, Euplotes, Engelmaniella und Stylonychia,' insbe- 
sondere der Gattung Stylonychia lemnae, mit Vektoren nach einem Transformations- 
verfahren, wie beschrieben in WO 98/01572, sowie bevorzugt in Zellen vielzelliger 
Pflanzen (siehe Schmidt, R. und Willmitzer, L. (1988) "High efficiency Agrobacterium 
tumefaciens-mediated transformation of Arabidopsis thaliana leaf and cotyledon ex- 
plants" Plant Cell Rep.:583-586; Plant Molecular Biology and Biotechnology, C Press 
Boca Raton, Florida, Kapitel 6/7, S.71-119 (1993); F.F. White. B. Jenes etal., Tech- ' 
niques for Gene Transfer, in: Transgenic Plants, Bd. 1. Engineering and Utilization, 
Hrsgb.: Kung und R. Wu, Academic Press (1993), 128-43; Potrykus, Annu. Rev. Plant 
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? ant H M ° ,e ?: Bl ° l 42 (1991 >' 205 " 225 dart" zitierte Literaturstellen)) 
expnm.ert werden. Geeignete Wirtszellen werden ferner erortert in Goedde., Gene Ex- 
nSZ n T6 ™. y: Methods in Enzymology 185, Academic Press. San Diego^cA 
(1990). Der retombmante Expressionsvektor kann alternativ, zum Beispiel urirW- 

Die Expression von Proteinen in Prokaryoten erfolgt meist mit Vektoren die konstituti- 
ve Oder ■nduz.erbare Promotoren enthalten, welche die Expression von rE£E5£ 

25" ma? m T 0 '. 3 B, ° teCh ' nC: Smith ' DB " und Johnson . K.S (1988) Gene 67 31- 
40) pMAL (New England Bioiabs, Beverly, MA) und pR.T5 (Pharmacia, P seaway 

P^in a h G,u ^ thio "- S - Tran ^e (GST), Maltose E-bindendes Protein bzw 
Protein A an das rekombinante Zielprotein fusioniert wird. 

Beisptele for geeignete induzierbare nicht-Fusions-E. coli-Expressionsvektoren sind 
u.a. pTrc (Amann et al. (1988) Gene 69:301-315) und pET 1 1d (Studier et al Gene 
Expressron Technology: Methods in Enzymology 185, Academic Press, San Diego 
Kal.forn.en (1990) 60-89). Die Zielgenexpression vom pTrc-Vektor beruht auf doT 
Transknpton durch Wirts-RNA-Porymerase von einem Hybrid-trp-lac-Fusionspromotor. 
Die Z,dgenexpress,on aus dem pET 1 1d-Vektor beruht auf der Transition von ei 
nem T7-gn10-lac-Fus.ons-Promotor, die von einer coexprimierten viralen RNA- 
Polymerase (T7 gn1) vermlttelt wind. Diese virale Polymerase wird von den Wirtsstam- 
Z£ di !£S> ° de ' HMS174 (° E 3) von einem residenten A-Prophagen be^gt 
stelit, der e.n T7 gnl-Gen unter der Transkriptionskontrolle des lacUV 5-Promotors 
Dirgt. 

Andere in prokaryotischen Organismen geeignete Vektoren sind dem Fachmann be- 
kannt, diese Vektoren sind beispielsweise in E. coli pLG338, pACYC184 die dBR- 
Re.he, wie pBR322, die pUC-Reihe, wie pUC18 oder pUC19, die M1 13mp-Reihe 
PKC30, pRep4 pHS1, pHS2, P PLc236, pMBL24, P LG200, pUR290, plN-IH113-Bl' 

iuR in P ^ "J Stre P tomvces P' J 364, plJ702 Oder plJ361, in Bacillus ' 

P UB1 10, pC194 Oder pBD214, in Corynebacterium pSA77 oder pAJ667. 

Bei einer weiteren AusfOhrungsform ist der Expressionsvektor ein Hefe-Expressions- 
vektor. Be.sp.ele fOr Vektoren zur Expression in der Hefe S. cerevisiae urr^seTpYe- 

6:229 " 234) ' pMFa und Herekowte 

( vlE?, ? 43) ' PJRY88 ( Schult2e ta'- (1987) Gene 54:113-123) sowie 

PYES2 (lny.trogen Corporation, San Diego, CA). Vektoren und Verfahren zur Konstru- 
kton von Vektoren die sich zur Verwendung in anderen Pilzen, wie den filamentosen 
2f n a Tf ? 7l assen die Jenigen, die eingehend beschrieben sind in: van den Hon- 
del, C. A M.J.J. , & Punt, P.J. (1991) "Gene transfer systems and vector deve.opment for 

STALES ,n: . r ppn To° ,ecu,ar Genetics of fungi - JF - Peberdv * H-gb 

Funom WB^um^ PreS u : Cambrid 9 e « oder in: Manipulations in 

Fung. [J.W. Bennet & LL. Lasure, Hrsgb., S. 396-428: Academic Press: San Diego]. 
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Weitere geeignete Hefevektoren sind beispfelsweise pAG-1, YEp6, YEd13 oder 
pEMBLYe23. 

Alternativ konnen die Acyl-CoA:Lysophospho!ipid-Acyltransferasen, Desaturasen 
und/oder Etongasen in Insektenzellen unter Verwendung von Baculovirus- 
Expressionsvektoren exprimiert werden. Baculovirus-Vektoren, die zur Expression von 
Proteinen in gezOchteten Insektenzellen (z.B. Sf9-Zellen) verfQgbar sind, umfassen die 
pAc-Reihe (Smith et al. (1983) Mol. Cell Biol.. 3:2156-2165) und die pVL-Reihe 
(Luckiow und Summers (1989) Virology 170:31-39). 

Die oben genannten Vektoren bieten nur einen kleinen Oberblick Ober mogliche geeig- 
nete Vektoren. Weitere Plasmide sind dem Fachmann bekannt und sind zum Beispiel 
beschrieben in: Cloning Vectors (Hrsgb. Pouwels, P.H., et al., Elsevier, Amsterdam- 
New York-Oxford, 1985, ISBN 0 444 904018). Weitere geeignete Expressionssysteme 
fur prokaryofsche und eukaryotische Zellen siehe in den Kapiteln 16 und 17 von 
Sambropk, J., Fritsch, E.F., und Maniatis, T., Molecular Cloning: A Laboratory Manual, 
2. Auflage, Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press Cold 
Spring Harbor, NY, 1989. 

Bei einer weiteren AusfOhrungsform des Verfahrens konnen die Acyl-CoA:Lyso- 
phospholipid-Acyltransferasen, Desaturasen und/oder Elongasen in einzelligen Fflan- 
zenzellen (wie Algen), siehe Falciatore etal., 1999, Marine Biotechnology 1 (3):239- 
251 und darin zitierte Literaturangaben, und Pflanzenzellen aus hoheren Pflanzen (z.B. 
Spermatophyten, wie Feldfruchten) exprimiert werden. Beispiele fOr Pflanzen- 
Expressionsvektoren umfassen solche, die eingehend beschrieben sind in: Becker, D., 
Kemper, E., Schell, J., und Masterson, R. (1992) "New plant binary vectors with selec- 
table markers located proximal to the left border", Plant Mol. Biol. 20:1 195-1 197; 
und Bevan, M.W. (1984) "Binary Agrobacterium vectors for plant transformation", Nucl. 
Acids Res. 12:871 1-8721; Vectors for Gene Transfer in Higher Plants; in: Transgenic 
Plants, Bd. 1, Engineering and Utilization, Hrsgb.: Kung und R. Wu, Academic Press 
1993, S. 15-38. 

Eine Pflanzen-Expressionskassette enthalt vorzugsweise Regulationssequenzen, wel- 
che die Genexpression in Pflanzenzellen steuern konnen und funktionsfahig verbunden 
sind, so dass jede Sequenz ihre Funktion, wie Termination der Transkription, erfullen 
kann, beispielsweise Polyadenylierungssignale. Bevorzugte Polyadenylierungssignale 
sind diejenigen, die aus Agrobacterium tumefaciens-T-DNA stammen, wie das als Oc- 
topinsynthase bekannte Gen 3 des Ti-Plasmids pTiACH5 (Gielen et al., EMBO 
J. 3 (1984) 835ff.) oder funktionelle Aquivaiente davon, aber auch alle anderen in 
Pflanzen funktionell aktlven Terminatoren sind geeignet 

Da die Pflanzengenexpression sehr oft nicht auf Transkriptionsebenen beschrankt ist, 
enthalt eine Pflanzen-Expressionskassette vorzugsweise andere funktionsfahig ver- 
bunden Sequenzen, wie Translationsenhancer, beispielsweise die Overdrive-Sequenz, 
welche die 5'-untranslatierte Leader-Sequenz aus Tabakmosaikvirus, die das Prote- 
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in/RNA-Verhaltnis erhoht, enthalt (Gallie et a!., 1987, Nucl. Acids Research 15:8693- 
8711). 

Die Pflanzengenexpression muss wie oben beschrieben funktionsfahig mit einem ge- 
eigneten Promotor verbunden sein, der die Genexpression auf rechtzeitige, zell- oder 
gewebespezifische Weise durchfQhrt. Nutzbare Promotoren sind konstitutive Promoto- 
ren (Benfey et al., EMBO J. 8 (1989) 2195-2202), wie diejenigen, die von Pflanzenviren 
stammen, wie 35S CAMV (Franck et al., Cell 21 (1980) 285-294), 19S CaMV (siehe 
auch US 5352605 und WO 84/02913) oder Pflanzenpromotoren, wie der in 
US 4,962,028 beschriebene der kleinen Untereinheit der Rubisco. 

Andere bevorzugte Sequenzen fOr die Verwendung zur funktionsfahigen Verbindung in ' 
Pflanzengenexpressions-Kassetten sind Targeting-Sequenzen, die zur Steuerung des 
Genproduktes in sein entsprechendes Zellkompartlment notwendig sind (siehe eine 
Ubersicht in Kermode, Crit. Rev. Plant Sci. 15, 4 (1996) 285-423 und darin zitoerte Lite- 
raturstellen), beispielsweise in die Vakuole, den Zellkern, alle Arten von Plastiden wie 
Amyloplasten, Chloroplasten, Chromoplasten, den extrazellularen Raum die Mito- 
chondrien, das Endoplasmatische Retikuium, OlkSrper, Peroxisomen und andere 
Kompartimente von Pflanzenzellen. 

Die Pflanzengenexpression lasst sich auch wie oben beschrieben Ober einen chemisch 
induzierbaren Promotor erleichtern (siehe eine Ubersicht in Gatz 1997 Annu Rev 
Plant Physiol: Plant Mol. Biol., 48:89-108). Chemisch induzierbare Promotoren eignen 
sich besonders, wenn gewOnscht wird, dass die Genexpression auf zeitspezifische 
Weise erfolgt. Beispiele fOr solche Promotoren sind ein Salicylsaure-induzierbarer 
Promotor (WO 95/19443), ein Tetracyclin-induzierbarer Promotor (Gatz et al (1992) 
Plant J. 2, 397-404) und ein Ethanol-induzierbarer Promotor. 

Auch Promotoren, die auf biotische oder abiotische Stressbedingungen reagieren, sind 
geeignete Promotoren, beispielsweise der pathogeninduzierte PRP1-Gen-Promotor 
(Ward et al.. Plant. Mol. Biol. 22 (1993) 361-366), der hitzeinduzierbare hspSO- 
Promotor aus Tomate (US 5,1 87,267), der kalteinduzierbare Alphaamylase-Promotor 
aus Kartoffel (WO 96/12814) oder der durch Wunden induzierbare pinll-Promotor 
(EP-A-0 375 091). 

Es sind insbesondere solche Promotoren bevorzugt, welche die Genexpression in Ge- 
weben und Organen herbeifOhren, in denen die Fettsaure-, Lipid- und Olbiosynthese 
stattfindet, in Samenzellen, wie den Zellen des Endosperms und des sich entwickeln- 
den Embryos. Geeignete Promotoren sind der Napingen-Promotor aus Raps 
(US 5,608,152), der USP-Promotor aus Vicia faba (Baeumlein et al., Mol Gen Genet, 

1991, 225 (3):459-67), der Oleosin-Promotbr aus Arabidopsis (WO 98/45461) der 
Phaseolin-Promotor aus Phaseolus vulgaris (US 5,504,200), der Bce4-Promotor aus 
Brassica (WO 91/13980) oder der Legumin-B4-Promotor (LeB4; Baeumlein et al 

1992, Plant Journal, 2 (2):233-9) sowie Promotoren, welche die samenspezifische Ex- 
pression .n Monokotyledonen-Pflanzen, wie Mais, Gerste, Weizen, Roggen, Reis usw 
herbeifuhren. Geeignete beachtenswerte Promotoren sind der Ipt2- oder Ipt1-Gen- 
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Prompter aus Gerste (WO 95/15389 und WO 95/23230) Oder die in WO 99/16890 be- 
schriebenen (Promotoren aus dem Gersten-Hordein-Gen, dem Reis-Glutelin-Gen, dem 
Reis-Oryzin-Gen, dem Reis-Prolamin-Gen, dem Weizen-Gliadin-Gen, Weizen-Gliitelin- 
Gen, dem Mais-Zein-Gen, dem Hafer-Glutelin-Gen, dem Sorghum-Kasirin-Gen, dem 
5 Roggen-Secalin-Gen). 

Insbesondere kann die multiparallele Expression der im Verfahren verwendeten Acyl- 
CoA:Lysophospholipid-Acyltransferasen ailein oder in Kombination mit Desaturasen 
und/oder Eiongasen gewQnscht sein. Die Einfiihrung solcher Expressionskassetten 
kann Ober eine simultane Transformation mehrerer einzelner Expressionskonstrukte 
1 0 erfolgen Oder bevorzugt durch Kombination mehrerer Expressionskassetten auf einem 
Konstrukt Auch kQnnen mehrere Vektoren mit jeweils mehreren Expressionskassetten 
transformiert und auf die Wirtszelie ubertragen werden. 

Ebenfalls besonders geeignet sind Promotoren, welche die plastidenspezifische Ex- 
pression herbeifOhren, da Plastiden das Kompartiment sind, in dem die Vorlaufer sowie 
einige Endprodukte der Lipidbiosynthese synthetisiert werden. Geeignete Promotoren, 
wie der virale RNA-Polymerase-Promotor, sind beschrieben in WO 95/16783 und WO 
97/06250, und der clpP-Promotor aus Arabidopsis, beschrieben in WO 99/46394. 

Vektor-DNA lasst sich in prokaryotische oder eukaryotische Zellen Ober herkommliche 
Transformations- oder Transfektionstechniken einbringen. Die Begriffe Transformati- 
20 on" und Transfektion", Konjugation und Transduktion, wie hier verwendet, sollen eine 
Vielzahl von im Stand der Technik bekannten Verfahren zum Einbringen fremder Nuk- 
leinsaure (z.B. DNA) in eine Wirtszelie, einschlieBlich Calciumphosphat- oder Calcium- 
chlorid-Coprazipitation, DEAE-Dextran-vermittelte Transfektion, Lipofektion, natOrii- 
che Kompetenz, chemisch vermittelter Transfer, Elektroporation oderTeilchenbe- 
25 schuss, umfassen. Geeignete Verfahren zur Transformation oder Transfektion von 
Wirtszellen, einschlieBlich Pflanzenzellen, lassen sich finden in Sambrook et al. (Mo- 
lecular Cloning: A Laboratory Manual., 2. Auf!., Cold Spring Harbor Laboratory, Cold 
Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989) und anderen Labor- 

• HandbQchem, wie Methods in Molecular Biology, 1995, Bd. 44, Agrobacterium proto- 
0 cols, Hrsgb: Gartland und Davey, Humana Press, Totowa, New Jersey. 

Wirtszellen, die im Prinzip zum Aufnehmen der erfindungsgemaBen Nukleinsaure, des. 
erfindungsgemaBen Genproduktes oder des erfindungsgemaBen Vektors geeignet 
sind, sind alle prokaryotischen oder eukaryotischen Organismen. Die vorteilhafterweise 
verwendeten Wirtsorganismen sind Mikroorganismen, wie Pilze oder Hefen oder Pflan- 

35 zenzellen vorzugsweise Pflanzen oder Teile davon. Pilze, Hefen oder Pflanzen werden 
vorzugsweise verwendet, besonders bevorzugt Pflanzen, ganz besonders bevorzugt 
Pflanzen, wie Olfruchtpflanzen, die groSe Mengen an Lipidverbindungen enthalten, wie 
Raps, Nachtkerze, Hanf, Diestel, Erdnuss, Canola, Lein, Soja, Safflor, Sonnenblume, 
Borretsch, oder Pflanzen, wie Mais, Weizen, Roggen, Hafer, Triticale, Reis, Gerste, 

40 Baumwolle, Maniok, Pfeffer. Tagetes, Solanaceen-Pflanzen, wie Kartoffel, Tabak, Au- 
bergine und Tomate, Vicia-Arten, Erbse, Alfalfa, Buschpflanzen (Kaffee, Kakao, Tee), 
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Salix-Arten, Baume (Olplame, Kokosnuss) sowie ausdauernde Graser und Futterfeld- 
frtlchte: Besonders bevorzugte erfindungsgemaSe Pflanzen sind Olfaichtpflanzen, wie 
Soja, Erdnufc, Raps, Canola, Lein, Hanf, Nachtkerze, Sonnenblume, Safflor, Baume 
(Olpalme, KokosnuB). . 

Ein weiterer erfindungsgemaSer Gegenstand sind wie oben beschrieben isolierte Nuk- 
leinsauresequenzen, die fur Polypeptide mit Acyl-CoA:Lysophospholipid- 
Acyltransferaseaktivitat codieren, wobei die durch die Nukleinsauresequenzen codier- 
ten Acyl-CoA:Lysophospholipid-Acyltransferasen spezifisch C 16 -. C 18 -, C 20 - Oder C^- 
Fettsauren mit mindestens einer Doppelbindungen im Fettsauremolekul umsetzen. 

Vorteilhafte isolierte Nukleinsauresequenzen sind Sequenzen ausgewahlt aus der 
Gruppe: 

d) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID 
NO: 5 oder SEQ ID NO: 7 dargestellten Sequenz, 

e) Nukleinsauresequenzen, die sich als Ergebnis des degenerierten genetischen 
Codes von der in SEQ ID NO: 1. SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID 
NO: 7 enthaltenden codierenden Sequenz ableiten lassen 

f) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 

7 dargestellten Nukleinsauresequenz, die fur Polypeptide mit der in SEQ ID 

NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 8 dargestellten Amino- 

sauresequenz codieren und mindestens 40 % Homologie auf Aminosaureebe- 

ne mit SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 8 auf- 

weisen und eine Acyl-CoALysophospholipid-Acyltransferaseaktivitat aufwei- 
sen. 

Die oben genannte erfindungsgemaften Nukleinsauren stammen von Organismen, wie 
Tieren, Ciliaten, Pilzen, Pflanzen wie Algen oder Dinoflagellaten, die PUFAs syntheti- 
sieren k6nnen. 

Der Begriff "Nukleinsaure(molekiil)", wie hier verwendet, umfasst in einer vorteilhaften 
Ausfuhrungsform zudem die am 3'- und am 5'-Ende des kodierenden Genbereichs 
gelegene untranslatierte Sequenz: mindestens 500, bevorzugt 200, besonders bevor- 
zugt 100 Nukleotide der Sequenz stromaufwarts des 5-Endes des kodierenden Be- 
reichs und mindestens 100, bevorzugt 50, besonders bevorzugt 20 Nukleotide der Se- 
quenz stromabwarts des 3'-Endes des kodierenden Genbereichs. Ein "isoliertes" Nuk- 
leinsauremolekOI wird von anderen NukleinsauremolekOlen abgetrennt, die in der na- 
ttirlichen Quelle der Nukleinsaure vorliegen. Eine "isolierte" Nukleinsaure hat vorzugs- 
weise keine Sequenzen, welche die Nukleinsaure in der genomischen DNA des Orga- 
nismus, aus dem die Nukleinsaure stammt, naturlicherweise flankieren (z.B. Sequen- 
zen, die sich an den 5'- und 3'-Enden der Nukleinsaure befinden). Bei verschiedenen 
AusfOhrungsformen kann das isolierte Acyl-CoA:Lysophospholipid- 
AcyltransferasemolekOI zum Beispiel weniger als etwa 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 
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kb Oder 0,1 kb an Nukleotidsequenzen enthalten, die natOriicherweise das Nukleinsau- 
remolekOI in der genomischen DNA der Zelle, aus der die Nukleinsaure stammt flankie- 
ren. 

Die im Vetfahren verwendeten NukleinsauremolekOle, z.B. ein NukleinsauremolekOI 
mit einer Nukleotidsequenz der SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 Oder 
SEQ ID NO: 7 odereines Teils davon, kann unter Verwendung molekularbiologischer 
Standardtechniken und der hier bereitgestellten Sequenzinformation isoliert werden. 
Auch kann mithilfe von Vergieichsalgorithmen beispielsweise eine homologe Sequenz 
oder homologe, konservierte Sequenzbereiche auf DNA Oder AminosSureebene identi- 
fiziert werden. Diese konnen als Hybridisierungssonde sowie Standard- 
Hybridisierungstechniken (wie z.B. beschrieben in Sambrook et aL, Molecular Cloning: 
A Laboratory Manual. 2. Aufl., Cold Spring Harbor Laboratory, Cold Spring Harbor La- 
boratory Press, Cold Spring Harbor, NY, 1989) zur Isolierung weiterer im Verfahren 
nQtzlicher Nukleinsauresequenzen verwendet werden. Oberdies lasst sich ein Nuklein- 
sauremolekOI, umfassend eine vollstandige Sequenz der SEQ ID NO: 1, SEQ ID NO: 
3, SEQ ID NO: 5 oder SEQ ID NO: 7 oder einen Teil davon, durch Polymeraseketten- 
reaktion isoiieren, wobei Oligonukleotidprimer, die auf der Basis dieser Sequenz oder 
yon Teilen davon, verwendet werden (z.B. kann ein NukleinsauremolekOI, umfassend 
die vollstandigen Sequenz oder einen Teil davon, durch Polymerasekettenreaktion 
unter Verwendung von Oligonukleotidprimem isoliert werden, die auf der Basis dieser 
gleichen Sequenz erstellt worden sind). Zum Beispiel lasst sich mRNA aus Zellen iso- 
iieren (z.B. durch das Guanidiniumthiocyanat-Extraktionsverfahren von Chirgwin et al 
(1979) Biochemistry 18:5294-5299) und cDNA mittels Reverser Transkriptase (z.B. 
Moloney-MLV-Reverse-Transkriptase, erhaltlich von Gibco/BRL, Bethesda, MD, oder 
AMV-Reverse-Transkriptase, erhaltlich von Seikagaku America, Inc., StPetersburg, 
FL) herstellen. Synthetische Oligonukleotidprimer zur Amplifizierung mittels Polymera- 
sekettenreaktion lassen sich auf der Basis einer der in SEQ ID NO: 1, SEQ ID NO: 3, 
SEQ ID NO: 5 oder SEQ ID NO: 7 gezeigten Sequenzen oder mithilfe der in SEQ ID 
NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 8 dargestellten Aminosaurese- 
quenzen erstellen. Eine erfindungsgemafie Nukleinsaure kann unter Verwendung von 
cDNA oder alternativ von genomischer DNA als Matrize und geeigneten Oligonukleo- 
tidprimem gemaR Standard-PCR-Amplifikationstechniken amplifiziert werden. Die 
so amplifizierte Nukleinsaure kann in einen geeigneten Vektor kloniert werden und mit- 
tels DNA-Sequenzanalyse charakterisiert werden. Oligonukleotide, die einer Desatura- 
se-Nukleotidsequenz entsprechen, konnen durch Standard-Syntheseverfahren, bei- 
spielsweise mit einem automatischen DNA-Synthesegerat, hergestellt werden. 

Homologe der verwendeten Acyl-CoALysophospholipid-Acyltransferase-Nukleinsaure- 
sequenzen mit -der Sequenz SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ. ID 
NO: 7 bedeutet beispielsweise allelische Varianten mit mindestens etwa 40 bis 60 %, 
vorzugsweise mindestens etwa 60 bis 70 %, starker bevorzugt mindestens etwa 70 bis 
80 %, 80 bis 90 % oder 90 bis 95 % und noch starker bevorzugt mindestens etwa 
95 %, 96 %, 97 %, 98 %, 99 % oder mehr Homologie zu einer in SEQ ID NO- 1 SEQ 
ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 gezeigten Nukleotidsequenzen Oder ihren 
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Homologen, Derivaten Oder Analoga oderTeilen davon. Weiterhin sind isolierte Nuk- 
leinsauremolekule einer Nukleotidsequenz, die an eine der in SEQ ID NO: 1, SEQ ID 
NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 gezeigten Nukleotidsequenzen oder einen 
Teil davon hybridisieren, z.B. unter stringenten Bedingungen hybridisiert Allelische 
Varianten umfassen insbesondere funktionelle Varianten, die sich durch Deletion, In- 
sertion oder Substitution von Nukleotiden aus/in der in SEQ ID NO: 1, SEQ ID NO 3 
SEQ ID NO: 5 oder SEQ ID NO: 7 dargestellten Sequenz erhalten lassen, wobei aber 
die Absicht ist, dass die Enzymaktivitat der davon herruhrenden synthetisierten Protei- 
ne fur die Insertion eines oder mehrerer Gene vorteilhafterweise beibehalten wird. Pro- 
teine, die noch die enzymatische Aktivitat der Acyl-CoALysophospholipid- 
Acyltransferase besitzen, das hei&t deren Aktivitat im wesentlichen nicht reduziert ist, 
bedeutet Proteine mit mindestens 10 %, vorzugsweise 20 %, besonders bevorzugt 
30 %, ganz besonders bevorzugt 40 % der urspriinglichen Enzymaktivitat, verglichen 
mit dem durch SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 ko- 
dierten Protein. 

Homologen der SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 be- 
deuten beispielsweise auch bakterielle, Pilz- und Pflanzenhomologen, verkOrzte Se- 
quenzen, einzelstrangige DNA oder RNA der kodierenden und nicht-kodierenden DNA- 
Sequenz. 

Homologen der SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 be- 
deutet auch Derivate, wie beispielsweise Promotorvarianten. Die Promotoren strom- 
aufwarts der angegebenen Nukleotidsequenzen konnen durch einen oder mehrere 
Nukleotidaustausche, durch Insertion(en) und/oder Deletion(en) modifiziert werden, 
ohne dass jedoch die Funktionalitat oder Aktivitat der Promotoren gestdrt wird. Es ' 
ist weiterhin moglich, dass die Aktivitat der Promotoren durch Modifikation ihrer Se- 
quenz erhoht ist oder dass sie vollstandig durch aktivere Promotoren, sogar aus hete- 
rologen Organismen, ersetzt werden. 

Die vorgenannten Nukleinsauren und Proteinmolekule mit Acyl-CoA:Lysophospholipid- 
Acyltransferaseaktivitat, die am Stoffwechsel von Lipiden und Fettsauren, PUFA- 
Cofaktoren und Enzymen oder am Transport lipophiler Verbindungen Qber Membranen 
beteiligt sind, werden im erfindungsgema&en Verfahren zur Modulation der Produktion 
von PUFAs in transgenen Organismen vorteilhaft in Pflanzen, wie Mais, Weizen, Rog- 
gen, Hafer, Triticale, Reis, Gerste, Sojabohne, Erdnuss, Baumwolle, Linum Arten wie 
Ol- oder Faserlein, Brassica-Arten, wie Raps, Canola und Rubsen, Pfeffer, Sonnen- 
blume, Borretsch, Nachtkerze und Tagetes, Solanaeaen-Pflanzen, wie Kartoffel, Ta- 
bak, Aubergine und Tomate, Vicia-Arten, Erbse, Maniok, Alfalfa, Buschpflanzen (Kaf- 
fee, Kakao, Tee),.Salix-Arten, B§ume (Olpalme. Kokosnuss) und ausdauemden Gra- 
sem und Futterfeldfriichten, entweder direkt (z.B. wenn die Oberexpression oder Opti- 
mierung eines Fettsaurebiosynthese-Proteins einen direkten Einfluss auf die Ausbeute, 
Produktion und/oder Effizienz der Produktion der Fetts§ure aus modifizierten Organis- ' 
men hat) verwendet und/oder konnen eine indirekt Auswirkung haben, die dennoch zu 
einer Steigerung der Ausbeute, Produktion und/oder Effizienz der Produktion der PU- 
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FAs Oder einer Abnahme unerwOnschter Verbindungen fOhrt (z.B. wenn die Modulation 
des Stoffwechsels von Lipiden und Fettsauren, Cofaktoren und Enzymen zu Verande- 
rungen der Ausbeute, Produktion und/oder Effizienz der Produktion Oder der Zusam- 
mensetzung der gewOnschten Verbindungen innerhalb der Zellen fuhrt, was wiederum 
5 die Produktion einer Oder mehrerer Fettsauren beeinflussen kann). 

Die Kombination verschiedener VorlaufermolekOle und Biosyntheseenzyme fuhrt zur 
Herstellung verschiedener Fettsauremolekule, was eine entscheidende Auswirkung auf 
die Zusammensetzung der Lipide hat Da mehrfach ungesattigte Fettsauren (= PUFAs) 
nicht nur einfach in Triacylglycerin sondern auch in Membranlipide eingebaut werden. 

1 0 Die Lipidsynthese lasst sich in zwei Abschnitte unterteilen: die Synthese von Fettsau- 
ren und ihre Bindung an sn-Glycerin-3-Phosphat sowie die Addition oder Modifikation 
einer polaren Kopfgruppe. Obiiche Lipide, die in Membranen verwendet werden, um- 
tassen Phospholipide. Glycolipide, Sphingolipide und Phosphoglyceride. Die Fettsau- 
resynthese beginnt mit der Umwandlung von Acetyl-CoA in Malonyl-CoA durch die 
Acetyl-CoA-Carboxylase Oder in Acetyl-ACP durch die Acetyltransacylase. Nach einer 
Kondensationsreaktion bilden diese beiden ProduktmolekQIe zusammen Acetoacetyl- 
ACP, das Ober eine Reihe von Kondensations-, Reduktions- und Dehydratisierungs- 
reaktionen umgewandelt wird, so dass ein gesattigtes FettsauremolekQI mit der ge- 
wQnschten Kettenlange erhalten wird. Die Produktion der ungesattigten Fettsauren aus 
20 diesen MolekQIen wird durch spezifische Desaturasen katalysiert, und zwar entweder 
aerob mittels molekularem Sauerstoff oder anaerob (bezQglich der Fettsauresynthese 
in Mikroorganismen siehe F.C. Neidhardt et al. (1996) E. coli und Salmonella. 
ASM Press: Washington, D.C., S. 612-636 und darin enthaltene Literaturstellen; Len- 
geler et al. (Hrsgb.) (1999) Biology of Procaryotes. Thieme: Stuttgart, New York', und 
25 die enthaltene Literaturstellen, sowie Magnuson, K., et al. (1993) Microbiological Re- 
views 57:522-542 und die enthaltenen Literaturstellen). Die so hergestellten an 
Phospholipide gebundenen Fettsauren mQssen anschlieRend wieder fOr die weitere 
Elongationen aus den Phospholipiden in den FettsaureCoA-Ester-Pool uberfuhrt wer- 
den. Dies ermoglichen die erfindungsgemaUen Acyl-CoA:Lysophospholipid- 
0 Acyltransferasen. Weiterhin kannen diese Enzyme die elongierten Fettsauren wieder 
von den CoA-Estem auf die Phospholipide ubertragen. Diese Reaktionsabfolge kann 
gegebenenfalls mehrfach durchlaufen werden (siehe Figur 10). 

Vorlaufer fur die PUFA-Biosynthese sind beispielsweise Olsaure, Linol- und Linolen- 
saure. Diese C 18 -Kohlenstoff-Fettsauren mflssen auf C 20 und verlangert werden, 

35 damit Fettsauren vom Eicosa- und Docosa-Kettentyp erhalten werden. Mithilfe der im 
Verfahren verwendeten Acyl-CoALysophospholipid-Acyltransferasen, vorteilhaft in 
Kombination mit Desaturasen wie der A-4-, A-5-, A-6- und A-8-Desaturasen und/oder 
der A-5-, A-6-, A-9-Elongase k5nnen Arachidonsaure, Eicosapentaens§ure, Docosa- 
pentaensaure oder Docosahexaensaure sowie verschiedene andere langkettige PU- 

40 FAs erhalten, extrahiert und fOr verschiedene Zwecke bei Nahrungsmittel-, Futter-, 

Kosmetik- oder pharmazeutischen Anwendungen verwendet werden. Mit den genann- 
ten Enzymen kQnnen vorzugsweise C 18 - f Czo-, und/oder Caz-Fettsauren mit mindestens 
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zwe. vorteilhaft mindestens drei, vier, fOnf oder sechs Doppelbindungen im Fettsaure- 
motekul, vorzugsweise zu und/oder C^Fettsauren mit vorteilhaft drei, vier oder 
fOnf Doppelbindungen im FettsauremolekGI hergestellt werden. Die Desaturierung kann 

c o° r ^ 5 "f rf lon9ation der entsprechenden Fettsaure erfolgen. Daher fuhren die 

5 Produkte der Desaturaseaktivitaten und der mQglichen weiteren Desaturierung und 
Elongation zu bevorzugten PUFAs mit hdherem Desaturierungsgrad, einschlieSlich 
einer weiteren Elongation von C, 0 zu C^Fettsauren.zu Fettsauren wie y-Linolensaure 
Dihomo-Y-linolensaure, Arachidonsaure, Stearidonsaure, Eicosatetraensaure oder Ei- 
cosapentaensaure. Substrate Substrat der Acyl-CoA:Lysophospholipid- 

0 Acyltransferasen im erfindungsgemaBen Verfahren sind C 16 -, C 18 -, C 20 - oder 
Fettsauren wie zum Beispiel Palmitinsaure, Palmitoleinsaure, Linolsaure y- 
Unolensaure, a.Linolensaure, Dihomo-y-linolensaure, Eicosatetraens§ure oder Steari- 
donsaure. Bevorzugte Substrate sind Linolsaure, y-Linolensaure und/oder a- 
Unolensaure, Dihomo-y-linolensaure bzw. Arachidonsaure, Eicosatetraensaure oder 

5 Bcosapentaensaure. Die C 18 -, C 2(P oder C^Fettsauren mit mindestens zwei Doppel- 
bindungen in der Fettsaure fallen im erfindungsgemaSen Verfahren in Form derfreien 

. Fettsaure oder in Form ihrer Ester beispielsweise in Form ihrer Glyceride an. 

Unter dem Begriff -Glycerid'' wird ein mit ein, zwei oder drei Carbonsaureresten ver- 
estertes Glycerin verstanden (Mono-, Di- oder Triglycerid). Unter "Glycerid" wird auch 
em Gemisch an verschiedenen Glyceriden verstanden. Das Glycerid oder das Gylce- 
ndgem.sch kann weitere Zusatze, z.B. freie Fettsauren, Antioxidantien, Proteine Koh- 
lenhydrate, Vitamine und/oder andere Substanzen enthalten. 

Unter einem "Glycerid" im Sinne des erfindungsgemaBen Verfahrens werden femer 
vom Glycerin abgeleitete Derivate verstanden. Dazu zahien neben den oben beschrie- 
benen Fettsaureglyceriden auch Glycerophospholipide und Glyceroglycolipide Bevor- 
zugt seien hier die Glycerophospholipide wie Lecithin (Phosphatidylcholin), Cardiolipin 
Phosphatidylglycerin, Phosphatidylserin und Alkylacylglycerophospholipide beispielhaft 
genannt. 

Femer mQssen Fettsauren anschlie&end an verschiedene Modifikationsorte transpor- 
J*l 0* ^^S'y^n'n-Speicherlipid eingebaut werden. Ein weiterer wichtiger 
Schrrtt be. der Lipidsynthese ist.der Transfer von Fettsauren auf die polaren Kopfgrup- 
pen, beispielsweise durch Glycerin-Fettsaure-Acyltransferase (siehe Frentzen 1998 
Lipid, 100(4-5): 161-1 66). ' 

Veroffentlichungen Oberdie Pflanzen-Fettsaurebiosynthese, Desaturierung, den Li- 
pidstoffwechsel und Membrantransport von fetthaltigen Verbindungen, die Betaoxidati- 
on, Fettsauremodifikation und Cofaktoren, Triacylglycerin-Speicherung und 
-Assemblierung einschlieSlich der Literaturstellen darin siehe in den folgenden Artikeln- 
Kinney, 1997, Genetic Engeneering, Hrsgb.: JK Setlow, 19:149-166; Ohlrogge und 
Browse, 1995, Plant Cell 7:957-970; Shanklin und Cahoon, 1998, Annu. Rev Plant 
Physiol. Plant Mol. Biol. 49:611-641; Voelker, 1996, Genetic Engeneering, Hrsgb.- JK 
Setlow, 18:111-13; Gerhardt, 1992, Prog. Upid R. 31:397-417; GQhnemann-Schafer & 
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Kind!, 1995, Biochim. Biophys Acta 1256:181-186; Kunau etal., 1995, Prog. Lipid Res. 
34:267-342; Stymne et al., 1993, in: Biochemistry and Molecular Biology of Membrane 
and Storage Lipids of Plants, Hrsgb.: Murata und Somerville, Rockville, American So- 
ciety of Plant Physiologists, 150-158, Murphy & Ross 1998. Plant Journal. 13(1):1-16. 

Die im Verfahren hergestellten PUFAs, umfassen eine Gruppe von MolekQIen, die hd- 
here Tiere nicht mehr synthetisieren kannen und somit aufnehmen mQssen Oder die 
h6here Tiere nicht mehr ausreichend selbst herstellen kSnnen und somit zusatzlich 
aufnehmen miissen, obwohl sie leicht von anderen Organismen, wie Bakterien, synthe- 
tisiert werden, beispielsweise konnen Katzen Arachidonsaure nicht mehr synthetisie- 
ren. 

Der Begriff-Acyl-CoA:LysophosphoIipid-Acyltransferasen " im Sinne derErfindung 
umfasst Proteine, die am Transfer der an Phospholipide gebundenen Fettsauren in den 
CoA-Ester-Pool und vice versa teilnehmen, sowie ihre Homologen, Derivaten Oder A- 
naloga. Unter Phospholipiden im Sinne der Erfindung sind zu verstehen Phosphatidyl- 
cholin, Phosphatidylethanolamin, Phosphatidylserin, Phosphatidylglycerin, und/oder 
Phosphatidylinositol vorteilhafterweise Phosphatidylcholin. Die Begriffe Acyl-CoA:Lyso- 
phospholipid-Acyltransferase-Nukleinsauresequenz(en) umfassen Nukleinsaurese- 
quenzen, die eine Acyl-CoA:Lysophospholipid-Acyltransferase kodieren und bei denen 
ein Teil eine kodierende Region und ebenfalls entsprechende 5'- und 3'-untranslatierte 
Sequenzbereiche sein konnen. Die Begriffe Produktion oder Produktivitat sind 
im Fachgebiet bekannt und beinhalten die Konzentration des Fermentationsproduktes 
(Verbindungen der Formel I), das in einer bestimmten Zeitspanne und einem besttmm- 
ten Fermentationsvolumen gebildet wird (z.B. kg Produkt pro Stunde pro Liter). Der 
Begriff Effizienz der Produktion umfasst die Zeit, die zur Erzielung einer bestimmten 
Produktionsmenge n6tig ist (z.B. wie lange die Zelle zur Aufrichtung einer bestimmten 
Durchsatzrate einer Feinchemikalie benStigt). Der Begriff Ausbeute oder Pro- 
dukt/Kohlenstoff-Ausbeute ist im Fachgebiet bekannt und umfasst die Effizienz der 
Umwandlung der Kohlenstoffquelle in das Produkt (d.h. die Feinchemikalie). Dies wird 
gewShnlich beispielsweise ausgedrQckt als kg Produkt pro kg Kohlenstoffquelle. Durch 
Erhohen der Ausbeute oder Produktion der Verbindung wird die Menge der gewonne- 
nen MolekQIe oder der geeigneten gewonnenen Molekiile dieser Verbindung in einer 
bestimmten Kulturmenge Qber einen festgelegten Zeitraum erhoht Die Begriffe Biosyn- 
these oder Biosyntheseweg sind im Fachgebiet bekannt und umfassen die Synthese 
einer Verbindung, vorzugsweise einer organischen Verbindung, durch eine Zelle aus 
Zwischenverbindungen, beispielsweise in einem Mehrschritt- und stark regulierten Pro- 
zess. Die Begriffe Abbau Oder Abbauweg sind im Fachgebiet bekannt und umfassen 
die Spaltung einer Verbindung, vorzugsweise einer organischen Verbindung, durch 
eine Zelle in Abbauprodukte (allgemeiner gesagt, kleinere oder weniger komplexe Mo- 
lekiile) beispielsweise in einem Mehrschritt- und stark regulierten Prozess. Der Begriff 
Stoffwechsel ist im Fachgebiet bekannt und umfasst die Gesamtheit der biochemi- 
schen Reaktionen, die in einem Organismus stattfinden. Der Stoffwechsel einer be- 
stimmten Verbindung (z.B. der Stoffwechsel einer Fettsaure) umfasst dann die Ge- 
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gramme und BestFit [Needteman and Wunsch (J MoLBto 48- 44^ « 97^°" 
gezeigten Nukleotidsequenzen kodiert wird. 

Zusatdich zu den in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO- 5 oder SEO ID mo- ? 

anten bewirken Qbllcherweise eine Varianz von 1 bis «5 »/ , ' ^7 If ® na ™ rl,cnen Var «- 
dern, sollen im Umfang der Erfindung enthalten sein. 
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Hybndis.erungstechniken unter stringenten Hybridisierungsbedingungen isoliert wer- 
den. Dabei konnen beispielswefse isolierte NukleinsauremolekQIe verwendet werden 
die mindestens 15 Nukleotide lang sind und unter stringenten Bedingungen mit 
dem Nukleinsauremolekulen, die eine Nukleotidsequenz der SEQ ID NO- 1 SEQ ID 
NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 umfassen, hybridisieren. Es konnen auch 
Nuklemsauren mindestens 25, 50, 100, 250 oder mehr Nukleotide verwendet werden 
Der Begrrff hybridisiert unter stringenten Bedingungen", wie hier verwendet, soil Hybri- 
disierungs- und Waschbedingungen beschreiben, unter denen Nukleotidsequenzen 
' mindestens 60 % homolog zueinander sind, gewohnlich aneinander hybridisiert ' 
^ ° le ffdingungen sind vorzugsweise derart, dass Sequenzen, die mindestens 
etwa 65 /», starker bevorzugt mindestens etwa 70 % und noch starker bevor- 
zugt mindestens etwa 75 % oder starker zueinander homolog sind, gewohnlich anein- 
ander hybndisiert bleiben. Diese stringenten Bedingungen sind dem Fachmann be- 

vnlZ m r 0 »™ n l Pr ° tocols in Mole ""ar Biology, John Wiley & Sons. N. 

(1989) - 6 -3.1-6.3.6.. finden. Em bevorzugtes, nicht einschrankendes Beispiel far 
stnngente Hybridisierungsbedingungen sind Hybridisierungen in 6 x Natriumchlo- 
nd/Natnumcitrat (sodium chloride/sodiumcitrate = SSC) bei etwa 45°C gefolgt von ei- 
nem oder mehreren Waschschritten in 0,2 x SSC, 0,1 % SDS bei 50 bis 65°C Dem 
Fachmann ist bekannt, dass diese Hybridisierungsbedingungen sich je nach dem Typ 
der Nukleinsaure und, wenn beispielsweise organische LSsungsmittel vorliegen. hin- 
sichtlich der Temperatur und der Konzentration des Puffers unterscheiden Die Tempe- 
ratur unterscheidet sich beispielsweise unter "Standard-Hybridisierungsbedingungen" 
je nach dem Typ der Nukleinsaure zwischen 42»C und 58°C in wassrigem Puffer mit 
einer Konzentration von 0.1 bis 5 x SSC (pH 7.2). Falls onganisches LSsungsmittel im 
obengenannten Puffer vorliegt. zum Beispiel 50 % Formamid. ist die Temperatur unter 

^ ™J ™ 1 u ^ 42 ° C ' Vor2U 9 sweise s| nd die Hybridisierungsbedingungen 
fur DNA: DNA-Hybnde zum Beispiel 0.1 x SSC und 20»C bis 45°C. vorzugsweise zwi- 
schen 30°C und 45°C. Vorzugsweise sind die Hybridisierungsbedingungen fOr 

^^f^n 6 2Um ?t Spl !' °' 1 X SSC und 30 ° C bls 55 ° c . vorzugsweise zwischen 
45 C und 55 C. Die vorstehend genannten Hybridisierungstemperaturen sind bei- 
spielsweise fur eine Nukleinsaure mit etwa 100 bp (= Basenpaare) Lange und einem G 
+ C-Gehalt von 50 % in Abwesenheit von Formamid bestimmt. Der Fachmann weiR 
wie die erforderlichen Hybridisierungsbedingungen anhand von Lehrbuchern. wie dem 
vorstehend erwahnten oder aus den folgenden LehrbOchern Sambrook et al.. -Molecu- 
lar C toning Cold Spring Harbor Laboratory. 1989; Hames und Higgins (Hrsgb.) 1985, 
Nucleic Adds Hybridization: A Practical Approach". IRL Press at Oxford University 
Press. Oxford: Brown (Hrsgb.) 1991, "Essential Molecular Biology: A Practical Ap- 
proach", IRL Press at Oxford University Press, Oxford, bestimmt werden konnen. 

Zur Bestimmung der prozentualen Homologie (= Identitat) von^wei Aminosaurese- 
quenzen (z.B. einer der Sequenzen der SEQ ID NO: 2. SEQ ID NO: 4, SEQ ID NO- 6 
oder SEQ ID NO: 8) oder von zwei Nukleinsauren (z.B. SEQ ID NO- 1* SEQ ID NO- 3 
SEQ ID NO: 5 oder SEQ ID NO: 7) werden die Sequenzen zum Zweck des optimalen 
Vergleichs untereinander geschrieben (z.B. konnen Lucken in die Sequenz eines Pro- 
teins oder einer Nukleinsaure eingefiigt werden, urn ein optimales Alignment mit dem 
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anderen Protein oder der anderen Nukleinsaure zu erzeugen). Die Aminosaurereste 
oder Nukleotide an den entsprechenden Aminosaurepositionen oder Nukleotidpositio- 
nen werden dann verglichen. Wenn eine Position in einer Sequenz durch den gieichen 
Aminosaurerest oder das gleiche Nukleotid wie die entsprechende Stelle in der ande- 
ren Sequenz betegt wird. dann sind die MolekOie an dieser Position homolog (d h A- 
minosaure- oderNukleinsaure--Homologie», wie hier verwendet, entspricht Arninosau- 
re- oder NuWeinsa^re-"ldentitaT). Die prozentuale Homologie zwischen den beiden 
Sequenzen ist eine Funktion der Anzahl an identischen Positionen, die den Sequenzen 
gememsam sind (d.h. % Homologie = Anzahl der identischen Positio- 
nen/Gesamtanzahl der Positionen x 100). Die Begriffe Homologie und Identitat sind 
damit als Synonym anzusehen. Die verwendeten Programme bzw. Algorithmen sind 
oben beschrieben. 

Ein isoliertes NukleinsauremolekOI, das eine Acyl-CoALysophospholipid-Acyl- 
transferase kodiert, die zu einer Proteinsequenz der SEQ ID NO- 2 SEQ ID NO- 4 
SEQ ID NO: 6 oder SEQ ID NO: 8 homolog ist, kann durch Einbringen einer oder rneh- 
rerer Nukleotidsubstitutionen, -additionen oder -deietionen in eine Nukleotidsequenz 
der SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 erzeugt werden 
so dass eine oder mehrere Aminosauresubstitutionen, -additionen oder -deietionen in' 
das kodierte Protein eingebracht werden. Mutationen konnen in eine der Sequenzen 
der SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 7 durch Standard- 
techniken, wie stellenspezifische Mutagenese und PCR-vermittelte Mutagenese ein- 
gebracht werden. Vorzugsweise werden konservative Aminosauresubstitutionen an 
einer oder mehreren der vorhergesagten nicht-essentiellen Aminosaureresten herge- 
stellt. Bei einer "konservativen Aminosauresubstitution" wird der Aminosaurerest gegen 
einen Aminosaurerest mit einer ahnlichen Seitenkette ausgetauscht Im Fachgebiet 
sind Familien von Aminosaureresten mit ahnlichen Seitenketten definiert worden Die- 
se Familien umfassen Aminosauren mit basischen Seitenketten (z.B. Lysin Arginin 
H.stid.n), sauren Seitenketten (z.B. Asparaginsaure, Glutaminsaure), ungeladenen po- 
laren Seitenketten (z.B. Glycin, Asparagin, Glutamin, Serin. Threonin, Tyrosin 
Cyste.n) unpolaren Seitenketten, (z.B. Alanin, Valin, Leucin, Isoleucin, Prolin.Phenyla- 
lanin, Methionin, Tryptophan), beta-verzweigten Seitenketten (z.B. Threonin Valin 
Isoleucin) und aromatischen Seitenketten (z.B. Tyrosin, Phenylalanin, Tryptophan ' 
Histidin). Ein vorhergesagter nicht-essentieller Aminosaurerest in einer Acyl- 
CoA:Lysophospholipid-Acyltransferase wird somit vorzugsweise durch einen anderen 
Aminosaurerest aus der gieichen Seitenkettenfamilie ausgetauscht. Alternate k6nnen 
bei einer anderen AusfOhrungsform die Mutationen zufallsgemaiJ Ober die gesamte 
oder einen Teil der Acyl-CoA:Lysophospholipid-Acyltransferase-kodierenden Sequenz 
eingebracht werden, z.B. durch Sattigungsmutagenese, und die resultierenden Mutan- 

5I ^"! n naCh dSr hfer bescnriebe nen Acyl-GoA:Lysophospholipid-Acyltransferase- 
Aktivitatdurchmustert werden, urn Mutanten zu identifizieren, die die Acyl-CoA Lyso- 
phospholipid-Acyltransferase-Aktivitat beibehalten haben. Nach der Mutagenese einer 
der Sequenzen der SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO- 7 
kann das kodierte Protein rekombinant exprimiert werden, und die Aktivitat des Prote- 
ins kann z.B. unter Verwendung der hier beschriebenen Tests bestimmt werden 
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Diese Erfindung wird durch die nachstehenden Beispieie weiter veranschaulicht die 
nicht als beschrankend aufgefasst werden sollten. Der Inhalt samtlicher in dieser Pa- 
tentanmeldung zitierten Literaturstelien, Patentanmeldungen, Patente und veroffent- 
lichten Patentanmeldungen ist hier durch Bezugnahme aufgenommen. 

Beispieie 

BeispieM: Allgemeine Verfahren 

a) Allgemeine Klonierungsverfahren: 

Klonierungsverfahren, wie beispielsweise Restriktionsspaltungen, Agarosegele- 
lektrophorese, Reinigung von DNA-Fragmenten, Transfer von Nukleinsauren auf Nitro- 
cellulose- und Nylonmembranen, Verbindung von DNA-Fragmenten, Transformation 
von Escherichia coli- und Hefe-Zellen, Anzucht von Bakterien und Sequenzanalyse 
rekombinanter DMA, wurden durchgefuhrt wie beschrieben in Sambrook et al (1989) 
(Cold Sprmg Harbor Laboratory Press: ISBN 0-87969-309-6) Oder Kaiser Michaelis 
und Mitchell (1994) "Methods in Yeast Genetics" (Cold Spring Harbor Laboratory 
Press: ISBN 0-87969-451-3). ^ 

b) Chemikalien 

Die verwendeten Chemikalien wurden, wenn im Text nicht anders angegeben in p A - 
Qualrtat von , den Firmen Fluka (Neu-Ulm), Merck (Darmstadt). Roth (Karlsruhe), Serva 
(He.delberg) und Sigma (Deisenhofen) bezogen. L6sungen wurden unter Verwendung 
von reinem pyrogenfreiem Wasser, im nachstehenden Text als H 2 0 bezeichnet aus 
emer Milli-Q-Wassersystem-Wasserreinigungsanlage (Millipore, Eschborn) hergestellt 
Restnktionsendonukleasen, DNA-modifizierende Enzyme und molekularbiologische 
Kits wurden bezogen von den Firmen AGS (Heidelberg), Amersham (Braunschweig) 
B.ometra (Gottingen), Boehringer (Mannheim), Genomed (Bad Oeynhausen) New 
England Biolabs (Schwalbach/Taunus), Novagen (Madison, Wisconsin, USA) Perkin- 
Bmer (Weiterstadt), Pharmacia (Freiburg), Qiagen (Hilden) und Stratagene (Amster- 
dam N.ederlande). Wenn nicht anders angegeben, wurden sie nach den Anweisungen 
des Herstellers verwendet. a 

c) Klonierung und Expression von Desaturasen und Elongasen 

Der Escherichia coli-Stamm XL1 Blue MRP kan (Stratagene) wurde zur Subklonierung 
der A-6-Desaturase aus Physcomitrella patens verwendet. FOr die funktionelle Expres- 
sion dieses Gens wurde der Saccharomyces cerevisiae-Stamm INVSc 1 (Invitrogen 
Co.) verwendet. E. coli wurde in Luria-Bertani-Briihe (LB, Duchefa, Haarlem, Nieder- 
ande) be. 37 C kultiviert. Wenn n6tig, wurde Ampicillin (100 mg/Liter) zugegeben, und 
A S ar < Gew - yVoL ) f Q«"feste LB-Medien hinzugefOgt. S. cerevisiae wurde bei 

' n YPG " Medium od ^ in komplettem Minimalmedium ohne Uracil 
(CMdum; siehe in: Ausubel, F.M., Brent, R., Kingston, R.E., Moore, D.D., Seidman 
J.G., Smrth, J.A, Struhl, K., Albright, LB., Coen, D.M., und Varki, A. (1995) Current 
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Protocols in Molecular Biology, John Wiley & Sons, New York) mit entweder 2 % 
(Gew./Vol.) Raffinose oder Glucose kultiviert FQr teste Medien wurden 2 % (Gew./Vol.) 
Bacto™-Agar (Difco) hinzugefugt. Die zur Klonierung und Expression verwendeten 
Plasmide sind pUC18 (Pharmacia) und pYES2 (Invitrogen Co.). 

5 d) Klonierung und Expression PUFA-spezifischer Desaturasen und Elongaen 

Fur die Expression in Pflanzen wurden cDNA Kloneaus SEQ ID NO: 9, 11 oder 13 so 
modifiziert, dass lediglich die Codierregion mittels Polymerase Kettenreaktion unter 
Zuhilfenahme zweier Oligonukleotide amplifiziert werden. Dabei wurde darauf geach- 
tet, dass eine Konsensusequenz vor dem Startcodon zur effizienten Translation ein- 

1 0 gehalten wurde. Entweder wurde hierzu die Basenfolge ATA oder AAA gewahlt und vor 
das ATG in die Sequenz eingefugt [Kozak, M. (1986) Point mutations define a sequen- 
ce flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes, 
Cell 44, 283-2929]. Vor diesem Konsensustriplett wurde zusatzlich eine Restriktions- 
schnittstelle eingefuhrt, die kompatibel sein muss zur Schnittstelle des Zielvektors, 

|d 5 in den das Fragment kloniert werden soil und mit dessen Hilfe die Genexpression in 

" Mikroorganismen oder Pflanzen erfolgen soil. 

Die PCR-Reaktion wurde mit Plasmid-DNA als Matrize in einem Thermocycler (Bio- 
metra) mit der Pfu-DNA-(Stratagene)Polymerase und dem folgenden Temperaturpro- 
gramm durchgefuhrt: 3 min bei 96°C, gefolgt von 30 Zyklen mit 30 s bei 96°C, 30 s bei 

20 55°C und 2 min bei 72°C, 1 Zyklus mit 10 min bei 72°C und Stop bei 4°C. Die 

Anlagerungstemperatur wurde je nach gewahlten Oligonukleotiden variiert. Pro Kiloba- 
senpaare DNA ist von einer Synthesezeit von etwa einer Minute auszugehen. Weitere 
Parameter, die Einfluss auf die PCR haben wie z.B. Mg-lonen, Salz, DNA Polymerase 
etc., sind dem Fachmann auf dem Gebiet gelaufig und konnen nach Bedarf variiert 

25 werden. 

Die korrekte Grofie des amplifizierten DNA-Fragments wurde mittels Agarose-TBE- 
Gelelektrophorese bestatigt. Die amplifizierte DNA wurde aus dem Gel mit dem QIA- 
quick-Gelextraktionskit (QIAGEN) extrahiert und in die Smal-Restriktionsstelle des 
dephosphorylierten Vektors pUC18 unter Verwendung des Sure Clone Ligations Kit 
0 (Pharmacia) ligiert, wobei die pUC-Derivate erhalten wurden. Nach der Transformation 
von E. coli XL1 Blue MRF kan wurde eine DNA-Minipraparation [Riggs, M.G., & 
McLachlan, A. (1986) A simplified screening procedure for large numbers of plasmid 
mini-preparation. BioTechniques 4, 310-313] an ampicillinresistenten Transformanden 
durchgefuhrt, und positive Klone mittels BamHI-Restriktionsanalyse identifiziert. 
35 Die Sequenz des klonierten PCR-Produktes wurde mittels Resequenzierung unter 
Verwendung des ABI PRISM Big Dye Terminator Cycle Sequencing Ready Reaction 
Kit (Perkin-Elmer, Weiterstadt) bestatigt. 
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e) Transformation von Agrobacterium 

Die Agrobacterium-vermittelte Pflanzentransformation wurde, wenn nicht anders be- 
schrieben, wie von Deblaere et al. (1984, Nucl. Acids Res. 13, 4777-4788) mit Hilfe 
eines Agrobacterium tumefaciens-Stamms durchgefQhrt. 

5 f) Pflanzentransformation 

Die Agrobacterium-vermittelte Pflanzentransformation wurde, wenn nicht anders be- 
schrieben, unter Verwendung von Standard-Transformations- und Regenerationstech- 
niken durchgefQhrt (Gelvin, Stanton B., Schilperoort, Robert A, Plant Molecular Biology 
Manual, 2. Aufl., Dordrecht: Kluwer Academic Publ., 1995, in Sect, Ringbuc Zentrale 
10 Signatur: BT1 1-P ISBN 0-7923-2731-4; Glick, Bernard R., Thompson, John E., Me- 
thods in Plant Molecular Biology and Biotechnology, Boca Raton: CRC Press, 1993, 
360 S., ISBN 0-8493-5164-2). 

^ Nach diesen kann beispielsweise Raps mittels Kotyledonen- oder Hypokotyltransfor- 
■ mation transformiert werden (Moloney et al., Plant Cell 8 (1 989) 238-242; De Block et 
F 15 al., Plant Physiol. 91 (1989) 694-701). Die Verwendung von Antibiotika fur die Agro- 
bacterium- und Pflanzenselektion hangt von dem fur die Transformation verwendeten 
binaren Vektor und Agrobacterium-Stamm ab. Die Rapsselektion wird dabei gew6hn- 
lich unter Verwendung von Kanamycin als selektierbarem Pflanzenmarker durchge- 
fQhrt. 

20 Die Transformation von Soja kann unter Verwendung von beispielsweise einer in 
EP-A-0 0424 047 (Pioneer Hi-Bred International) oder in EP-A-0 0397 687, US 
5,376,543, US 5,169,770 (University Toledo) beschriebenen Technik durchgefQhrt 
werden. 

Die Pflanzentransformation unter Verwendung von Teilchenbeschuss, Polyethylen- 
25 glycol-vermittelter DNA-Auf nahme oder Qber die Siliziumcarbonatfaser-Technik ist bei- 
spielsweise beschrieben von Freeling und Walbot The maize handbook" (1993) 
ISBN 3-540-97826-7, Springer Verlag New York). 

Der Agrobacterium-vermittelte Gentransfer in Lein (Linum usitatissimum) wurde, wenn 
nicht anders beschrieben, wie bei Mlynarova et al. [(1994) Plant Cell Report 13:282- 
30 285] beschriebenen Technik durchfuhrt. 

g) Plasmide fur die Pflanzentransformation 

Zur Pflanzentransformation wurden binare Vektoren auf Basis der Vektoren pBinAR 
(Hofgen und Willmitzer, Plant Science 66 (1990) 221-230) oder pGPTV (Becker et al 
1992, Plant Mol. Biol. 20:1 195-1197) verwendet Die Konstruktion der binaren Vekto- 
35 ren, die die zu exprimierenden Nukleinsauren enthalten, erfolgt durch Ligation der 

cDNA in Sense-Orientierung in die T-DNA erfolgen. 5' der cDNA aktiviert ein Pflanzen- 
promotor die Transkription der cDNA. Eine Polyadenylierungssequenz befindet sich 3' 



BASF Plant Science GmbH 



20030015 



PF 54305 DE 



46 



von der cDNA. Die binaren Vektoren kSnnen unterschiedliche Markergene tragen wie 
beispielsweise das Acetolactat Synthasegens (AHAS Oder ALS) [Ott et al., J. Mol. Biol. 
1996, 263:359-360], das eine Resistenz gegen die Imidazolinone vermittelt oder das 
nptll-Markergen, das fOr eine Kanamycin-Resistenz vermittelt durch Neomy- 
cinphosphotransferase codiert. 

Die gewebespezifische Expression der Nukleinsauren lasst sich unter Verwendung 
eines gewebespezifischen Promotors erzielen. Wenn nichtanders beschrieben wurde 
der LeB4- oder der USP-Promotor oder der Phaseolin-Promotor 5' der cDNA einklo- 
niert wird. Als Terminatoren wurde der NOS-Terminator und der OCS-Terminator ver- 
wendet (siehe Figur 8). Figur 8 zeigt eine Vektorkarte des zur Expression verwendeten 
Vektor pSUN3Cel_PLAT. 

Auch jedes andere samenspezifische Promotorelement wie z.B. der Napin- oder Arce- 
lin Promoter Goossens et al. 1999, Plant Phys. 120(4): 1095-1 103 und Gerhardt et al. 
2000, Biochimica et Biophysica Acta 1490(1-2):87-98) kann verwendet werden. 

Zur konstitutiven Expression in der ganzen Pflanzen lasst sich der CaMV-35S- 
Promotor oderein v-ATPase C1 Promotor verwenden. 

Die im Verfahren verwendeten Nukleinsauren, die fur die Acyl-CoA:Lysophospholipid- 
Acyltransferasen; Desaturasen oder Elongasen codieren, wurden durch Konstruktion 
mehrerer Expressionskassetten hintereinander in einen binaren Vektor kloniert, urn 
den Stoffwechselweg in Pflanzen nachzubilden. 

Innerhalb einer Expressionskassette kann das zu exprimierende Protein unter Verwen- 
dung eines Signalpeptids, beispielsweise fur Plastiden, Mitochondrien oder das En- 
doplasmatische Retikulum, in ein zellulares Kompartiment dirigiert werden (Kermode, 
Crit. Rev. Plant Sci. 15, 4 (1996) 285-423). Das Signalpeptid wird 5' im Leseraster mit 
der cDNA einkloniert, urn die subzellulare Lokalisierung des Fusionsprotein zu errei- 



Beispiele fur Multiexpressionskassetten wurden jo' ) 1 02 1 9 203 offenbart und sind 
im folgenden nochmals wiedergegeben. 

i.) Promotor-Terminator-Kassetten 

Expressionskassetten bestehen aus wenigstens zwei funktionellen Einheiten wie ei- 
nem Promotor und einem Terminator. Zwischen Promotor und Terminator konnen wei- 
tere gewunschte Gensequenzen wie Targetting-Sequenzen, Codierregionen von Ge- 
nen oderTeilen davon etc. eingefugt werden. Zum Aufbau der Expressionskassetten 
wurden Promotoren und Terminatoren (USP Promotor: Baeumlein et al., Mol Gen Ge- 
net, 1991, 225 (3):459-67); OCS Terminator Gielen et al. EMBO J. 3 (1984) 835ff.) 
mithilfe der Polymerasekettenreaktion isoliert und mit flankierenden Sequenzen nach 
Wahl auf Basis von synthetischen Oligonukleotiden maBgeschneidert. 
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Folgende Oligonukleotide konnen beispielsweise verwendet werden: 
USP1 vome: 

- CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA - 
USP2 vorne: 

5 - CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA - 
USP3 vorne: 

- CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA - 
USP1 hinten: 

- AAAACTGCAGGCGGCCGCCCACCGCGGTGGGCTGGCTATGAAGAAATT - 

10 USP2 hinten: 

- CGCGGATCCGCTGGCTATGAAGAAATT - 

i USP3 hinten: 

" - TCCCCCGGGATCGATGCCGGCAGATCTGCTGGCTATGAAGAAATT - 
OCS1 vorne: 

1 5 - AAAACTGCAGTCTAGAAGGCCTCCTGCTTTAATGAGATAT - 
OCS2 vorne: 

- CGCGGATCCGATATCGGGCCCGCTAGCGTTAACCCTGCTTTAATGAGATAT - 
OCS3 vorne: 

- TCCCCCGGGCCATGGCCTGCTTTAATGAGATAT - 
20 OCS1 hinten: 

- CCCAAG CTTGGCG CGCCG AG CTCGAATTCGTCGACGG ACAATCAGTAAATTG A - 
OCS2 hinten: 

- CCCAAGCTTGGCGCGCCGAGCTCGAATTCGTCGACGGACAATCAGTAAATTGA - 
OCS3 hinten: 

25 - CCCAAGCTTGGCGCGCCGAGCTCGTCGACGGACAATCAGTAAATTGA - 

Die Methoden sind dem Fachmann auf dem Gebiet bekannt und sind allgemein litera- 
turbekannt. 

In einem ersten Schritt wurden ein Promotor und ein Terminator uber PCR amplifiziert. 
Dann wurde der Terminator in ein Empfangerplasmid kloniert und in einem zweiten 
30 Schritt der Promotor vor den Terminator inseriert. Dadurch wurde eine Expressions- 
kassette in das Basis-Plasmid cloniert Auf Basis des Plamides pUC19 wurden so die 
Plasmide pUT1, 2 und 3 ersteilt 
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Die entsprechenden Konstrukte bzw. Plasmide sind in SEQ ID NO: 15, 16 bis 17 defi- 
niert. Sie enthalten den USP-Promotor und den OCS Terminator. Auf Basis dieser 
Plasmide wurde das Konstrukt pUT12 erstellt, indem pUT1 mittels Sail/Seal geschnit- 
ten wurde und pUT2 mittels Xhol/Scal geschnitten wurde. Die die Expressionskasset- 
ten enthaltenden Fragmente wurden ligiert und in E. coli XL1 blue MRF transformiert 
Es wurde nach Vereinzelung von ampiciilinresistenten Kolonien DNA prapariert und 
per Restnktonsanalyse soiche Klone identifiziert, die zwei Expressionskassetten ent- 
halten. Die Xhol/Sall Ligation kompatibler Enden hat dabei die beiden Schnittstellen 
Xhol und Sail zwischen den Expressionskassetten eleminiert Das resultierende Plas- 
m.d pUT12 wird in SEQ ID NO: 18 wiedergegeben. Anschlieftend wurde pUT12 wie- 
derum mittels Sal/Seal geschnitten und pUT3 mittels Xhol/Scal geschnitten Die die 
Expressionskassetten enthaltenden Fragmente wurden ligiert und in E. coli XLI blue 
MRF transformiert. Es wurde wieder nach Vereinzelung aus ampiciilinresistenten Kolo- 
nien DNA prapariert und per Restriktionsanalyse soiche Klone identifiziert die drei Ex- 
pressionskassetten enthalten. Auf diese Weise wurde ein Set von Multiexpressions- 
kassetten geschaffen, dass fur die Insertion gewunschter DNA genutzt werden kann 
und in Tabelle 1 beschrieben wird und zudem noch weitere Expressionskassetten auf- 
nehmen kann. 



Diese enthalten folgende Elemente: 



Tabelle 1 



PUC19- 
Derivat 


Schnittstellen vor dem 
USP Promoter 


Multiple 
Klonierungs-Schnittstellen 


Schnittstellen hinter dem 
PCS-Terminator 


PUTl 


EcoRI/AscI/ Sacl/Xhol 


BstXI/NotI/ Pstl/Xbal/StuI 


Sall/EcoRI/ SacI/AscI/ 
HindlH 


PUT2 


EcoRI/AscI/ Sacl/Xhol 


BamHI/EcoRV/ Apal/Nhel/ Hpal 


Sall/EcoRI/ SacI/AscI/ 
HindlH 


PUT3 


EcoRI/AscI/ Sacl/Xhol 


BgUI/Nael/ Clal/Smal/Ncol 


Sall/SacI/ Ascl/Hindm 


PUT12 
Doppel- 
expressions- 
kasette 


EcoRI/AscI/ Sacl/Xhol 


BstXI/NotI/ Pstl/Xbal/StuI 
Und 

BamHI/EcoRV/ Apal/Nhel/ Hpal 


Sall/EcoRI/ SacI/AscI/ 
HindlH 


PUT123 
Tripel- 
expressions- 
kassette 


EcoRI/AscI/ Sacl/Xhol 


1. BstXI/NotI/ Pstl/Xbal/StuI 
und 

2. BamHI/EcoRV/ Apal/Nhel/ Hpal 
und 

3. BgUI/Nael/ Clal/Smal/Ncol 


Sall/Sacl/Ascl/Hindin 
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Weiterhin lassen sich wie beschrieben und wie in Tabelle 2 naher spezifiziert weitere 
Multiexpressionskassetten mithilfe des 

i) USP-Promotors oder mithilfe des 

ii) 700 Basenpaare 3'-Fragmentes des LeB4-Promotors oder mithilfe des 

5 Hi) DC3-Promotors erzeugen und fur samenspezifische Genexpression einsetzen. 

Der DC3-Promotor ist beschrieben bei Thomas, Plant Cell 1996, 263:359-368 und be- 
steht lediglich aus der Region -117 bis +26 weshalb er mithin einer der kleinsten be- 
kannten samenspezifischen Promotoren darstellt. Die Expressionskassetten konnen 
mehrfach den selben Promotor enthalten oder aber uber drei verschiedene Promotoren 
1 0 aufgebaut werden. 

Vorteilhaft verwendete Polylinker- bzw. Polylinker-Terminator-Polylinker sind den Se- 
k quenzen SEQ ID NO: 23 bis 25 zu entnehmen. 



Tabelle 2: Multiple Expressionskassetten 



Plasmidname des 
pUC19-Derivates 


Schnittstellen vor dem 
jeweiligen Promotor 


Multiple 
Klonierungs-Schnittstellen 


Schnittstellen hinter 
dem OCS-Tenninator 


pUTl 

(pUC19mit 
USP-OCS1) 


EcoRI/AscI/SacI/XhoI 


(1) BstXI/Notl/PstI/ Xbal/StuI 


Sall/EcoRI/SacI/AscI/ 
Hindin 


PDCT 

(pUC19mitDC3- 
OCS) 


EcoRI/AscI/SacI/XhoI 


(2) BamHI/EcoRV/ Apal/Nhel/ 
Hpal 


Sall/EcoRI/SacI/AscI/ 
HindTTT 


PleBT 

(pUC19-mit 

LeB4(700)-OCS) 


EcoRI/AscI/SacI/XhoI 


(3) BgUI/Nael/ Clal/Smal/Ncol 


SaU/SacI/AscI/Hindm 


PUD 12 

(pUC 19mitmit 
USP-OCS1 und 
mitDC3-OCS) 


EcoRI/AscI/SacI/XhoI 


(1) BstXI/NotI/ Pstl/Xbal/StuI 
und 

(2) BamHI/EcoRV/ Apal/Nhel/ 
Hpal 


Sall/EcoRI/SacI/AscI/ 
Hindin 


PUDL123 
Triple expression 
cassette 
(pUC19 mit 
USP/DC3 und 
LeB4-700) 


EcoRI/AscI/SacI/XhoI 


(1) BstXI/NotI/ Pstl/Xbal/StuI und 

(2) BamHI/ (EcoRV m )/ApaUNhoU 
Hpal und 

(3) Bglll/Nael/ Clal/SraaLTMcol 


Sall/Sacl/Ascl/Hindni 



EcoRV Schnittstelle schneidet im 700 Basenpaarfragment des LeB4 Promotors 
(LeB4-700) 
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Analog lassen sich weitere Promotoren fur Multigenkonstrukte erzeugen insbesondere 
unter Verwendung des 

a) 2,7 kB Fragmentes des LeB4-Promotors oder mithilfe des 

b) Phaseolin-Promotors oder mithilfe des 

c) konstitutiven v-ATPase d-Promotors. 

Es kann insbesondere wQnschenswert sein, weitere besonders geeignete Promotoren 
zum Aufbau samenspezifischer Multiexpressionskassetten wie z.B. den Napin- 
Promotor oder den Arcelin-5 Promotor zu verwenden. 

Weitere in Pflanzen nutzbare Vektoren mit einer bzw. zwei oder drei Promotor- 
Terminator-Expressionkassetten sind den Sequenzen SEQ ID NO: 26 bis 
SEQ ID NO: 31 zu entnehmen. 

ii.) Erstellung von Expressionskonstrukten, die Promotor, Terminator und ge- 

wunschte Gensequenz zur PUFA Genexpression in pflanzlichen Expressions- 
kassetten enthalten. 

In pUT123 wird zunachst Qber BstXI und Xbal die A-6-Elongase Pp_PSE1 in die erste 
Kassette inseriert Dann wird die A-6-Desaturase aus Moos (Pp_des6) Qber Bam- 
Hl/Nael in die zweite Kassette inseriert und schliefclich die A-5-Desaturase 
aus Phaeodactylum (Pt_des5) Qber Bglll/Ncol in die dritte Kassette inseriert (siehe 
SEQ ID NO: 19). Das Dreifachkonstrukt erhalt den Namen pARA1. Unter Berucksichti- 
gung sequenzspezifischer Restriktionsschnittstellen k6nnen weitere Expressionskas- 
setten gemaBTabelle 3 mit der Bezeichnung pARA2, pAPA3 und pARA4 erstellt wer- 
den. 
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Tabelie 3: Kombinationen von Desaturasen und Elongasen 



Gen 


A-6-Desaturase 


A-5-Desaturase 


A-6-Elongase 


Plasmid 






pARAl 


Pp des6 


Pt des5 


Pp PSE1 


pARA2 


Pt des6 


Pt des5 


Pp PSE1 


PARA3 


Pt des6 


Ce des5 


Pp PSE1 


PARA4 


Ce_des6 


Ce_des5 


CeJPSEl 



des5 = PUFA spezifische A-5-Desaturase 

des6 = PUFA spezifische A-6-Desaturase 

PSE = PUFA spezifische A-6-Elongase 

R_des5 = A-5-Desaturase aus Phaeodactylum tricornutum 

Pp_des6 Oder Pt_des6 = A-6-Desaturase aus Physcomitrella patens bzw. Phaeodacty- 
lum tricornutum 
Pp = Physcomitrella patens, Pt = Phaeodactylum tricornutum 
Pp_PSE1 = A-6-Elongase aus Physcomitrella patens * 
Pt_PSE1 = A-6-Elongase aus Phaeodactylum tricornutum 

Ce_des5 = A-5-Desaturase aus Caenorhabditis elegans (Genbank Acc. Nr. AF078796) 
Ce_des6 = A-6-Desaturase aus Caenorhabditis elegans (Genbank Acc. Nr AF031477 
Basen 11-1342) 

Ce_PSE1 = A-6-Elongase aus Caenorhabditis elegans (Genbank Acc. Nr. AF244356, 
Basen 1-867) 

Auch weitere Desaturasen Oder Elongasegensequenzen konnen in Expressionskasset- 
ten beschriebener Art inseriert werden wie z.B. Genbank Acc. Nr. AF231981 
NM_013402, AF206662, AF268031, AF226273, AF110510 Oder AF1 10509. ' 

iii.) Transfer von Expressionskassetten in Vektoren zur Transformation von Agrobak- 
terium tumefaciens und zur Transformation von Pflanzen 

Die so erstellten Konstrukte wurden mittels AscI in den binaren Vektor pGPTV inseriert. 
Die multiple Klonierungssequenz wurde zu diesem Zweck urn eine AscI Schnittstelle 
erweitert. Zu diesem Zweck wurde der Polylinker als zwei doppelstrangige Oligo- 
nukleotide neu synthetisiert, wobei eine zusatzliche AscI DNA Sequenz eingefugt wird 
Das Oligonukleotid wurde mittels EcoRI und Hindlll in den Vektor pGPTV inseriert. Die 
notwendigen Kloniertechniken sind dem Fachmann bekannt und k6nnen einfach wie in 
Beispiel 1 beschrieben nachgelesen werden. 

Fur die im foigenden beschriebenen Versuche wurden als Nukleinsauresequenzen fur 
die A-5-Desaturase (SEQ ID NO: 13), die A-6-Desaturase (SEQ ID NO: 9) und die A-6- 
Elongase (SEQ ID NO: 11), die Sequenzen aus Physcomitrella patens und Phaedacty- 
lum tricornutum verwendet. Die entsprechenden Aminosauresequenzen sind den Se- 
quenzen SEQ ID NO: 10, SEQ ID NO: 12 und SEQ ID NO: 14. Ein Vektor der alle vor- 
genannten Gene enthalt ist in SEQ ID NO: 19 wiedergegeben. Die korrespondierenden 
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Aminosaurensequenzen der Gene sind SEQ ID NO: 20, SEQ ID NO: 21 und SEQ ID 
NO: 22 zu entnehmen. 

Beispiel 2: Klonierung und Charakterisierung der ceLPLATs 

a) Datenbanken-Suche 

Die Identifizierung der ceLPLATs (= Acyl-CoA:Lysophosphollpid-Acyltransferase aus 
Caenorhabditis elegans) erfolgte durch Sequenzvergleiche mit bekannten LPA-ATs 
Die Suche wurde mit Hilfe des BLAST-Psi-Algorithmus (Altschul et al., J. Mol Biol 
1990, 215: 403-410) auf das Nematodengenom (Caenorhabditis elegans) beschrankt 
da dieser Organismus LCPUFAs synthetisiert. FOr den Sequenzvergleich diente ais 
Sonde eine LPAAT Proteinsequenz aus Mus musculus (MsLPAAT Accession Nr. 
NP_061350). LPLAT katalysiert durch eine reversible Transferasereaktion die ATP- 
unabhangige Synthese von Acyl-CoAs aus Phospholipiden mit Hilfe von CoA als Co- 
factor (Yamashita et al., J. Biol. Chem. 2001. 20: 26745-26752). Durch Sequenzver- 
gleiche konnten zwei putative ceLPLAT-Sequenzen identifiziert werden (Accession Nr. 
T06E8.1 bzw. F59F4.4). Die identifizierten Sequenzen weisen die grSfcte Ahnlichkeit 
jeweils zueinander und zu MsLPAATs auf (Figur 1). Das Alignment wurde mit dem 
Programm Clustal erstellt. 

b) Klonierung der CeLPLATs 

Auf der Basis der ceLPLAT-Nukleinsauresequenzen wurden Primerpaare synthetisiert 
(Tab. 1) und mittels PCR-Verfahren die zugehorigen cDNAs aus einer C. eiegans- 
cDNA-Bank isoliert. Die entsprechenden Primerpaare wurden so ausgewahlt, dass sie 
die Hefe-Konsensus-Sequenz fOr hocheffiziente Translation (Kozak, Cell 1986, 44:283- 
292) neben dem Startcodon trugen. Die Amplifizierung der LPLAT-cDNAs wurde je- 
wells mit 2 ul cDNA-Bank-L6sung als Template, 200 uM dNTPs, 2,5 U "proof-reading" 
pfu-Polymerase und 50 pmol eines jeden Primers in einem Gesamtvolumen von 50 pi 
durchgefQhrt Die Bedingungen fur die PCR waren wie folgt: Erste Denaturierung bei 
95°C fur 5 Minuten, gefolgt von 30 Zyklen bei 94°C fur 30 Sekunden, 58°C fur eine 
Minute und 72°C fur 2 Minuten sowie ein letzter Verlangerungsschritt bei 72°C fOr 10 
Minuten. Die Sequenz der LPLAT-cDNAs wurde durch DNA-Sequenzierung bestatigt 
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Tabelle 4: Nukleotidsequenzen der PCR-Primer zur Klonierung von CeLPLATs 



Primer 


Nukleotidsequenz 


5 T06E8.ir 


5' ACATAATGGAGAACTTCTGGTCGATCGTC 3' 


3'T06E8.1r* 


5' TTACTCAGATTTCTTCCCGTCTTT 3' 


5* F59F4.4f* 


5' ACATAATGACCTTCCTAGCCATATTA 3' 


3" F59F4.4r* 

•*■ r r « _ 


5* TCAGATATTCAAATTGGCGGCTTC 3" 



* f: forward, r: reverse 



F Beispiel 3: Analyse der Auswirkung der rekombinanten Proteine auf die Produktion 
des gewunschten Produktes 

5 a) Aufarbeitungsmoglichkeiten 

Die Auswirkung der genetischen Modifikation in Pilzen, Algen, Ciliaten oder wie in den 
Beispielen weiter oben beschrieben in Hefen auf die Produktion der mehrfach ungesat- 
tigten Fettsauren oder Pfianzen kann bestimmt werden, indem die modifizierten Mikro- 
organismen oder die modifizierte Pfianze unter geeigneten Bedingungen (wie den vor- 
10 stehend beschriebenen) gezuchtet werden und das Medium und/oder die zellularen 
Komponenten auf die erhohte Produktion der Lipide oder Fettsauren untersucht wird. 
Diese Analysetechniken sind dem Fachmann bekannt und umfassen Spektroskopie, 
Dunnschichtchromatographie, Farbeverfahren verschiedener Art, enzymatische und 
mikrobiologische Verfahren sowie analytische Chromatographie, wie Hochleistungs- 
15 Flussigkeitschromatographie (siehe beispielsweise Uliman, Encyclopedia of Industrial 
Chemistry, Bd. A2, S. 89-90 und S. 443-613, VCH: Weinheim (1985); Fallon, A., et al., 
(1987) "Applications of HPLC in Biochemistry" in: Laboratory Techniques in Biochemis- 
try and Molecular Biology, Bd. 17; Rehm et al. (1993) Biotechnology, Bd. 3, Kapitel 111: 
"Product recovery and purification", S. 469-714, VCH: Weinheim; Belter, P.A., et al. 
20 (1988) Bioseparations: downstream processing for Biotechnology, John Wiley and 

Sons; Kennedy, J.F., und Cabral, J.M.S. (1992) Recovery processes for biological Ma- 
terials, John Wiley and Sons; Shaeiwitz, J. A, und Henry, J.D. (1988) Biochemical 
Separations, in: Ullmann's Encyclopedia of Industrial Chemistry, Bd. B3; Kapitel 11, S. 
1-27, VCH: Weinheim; und Dechow, FJ. (1989) Separation and purification techniques 
25 in biotechnology, Noyes Publications). 

Neben den oben erwahnten Verfahren zum Nachweis von Fettsauren in Hefen werden 
Pflanzenlipide aus Pflanzenmaterial wie von Cahoon et al. (1999) Proc. Natl. Acad. Sci. 
USA 96 (22): 12935-1 2940, und Browse et al. (1986) Analytic Biochemistry 152:141- 



iO 
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145 beschrieben extrahiert. Die qualitative und quantitative Lipid- oder Fettsaure- 
analyse ,st beschrieben bei Christie, William W., Advances in Lipid Methoddcgy 
Ayr/Scotland: O.ly Press (Oi.y Press Lipid Library; 2); Christie, William W Gas Chro- 

1992, I* 307 S (0,ly Press L.p,d Library; 1); "Progress in Lipid Research, Oxford" Per- 
UpTdsCODEN ° 952) ' 16 (19?7) UdT - : Pr09reSS ^ the Ct « " ^ts ana" Otter 

So kann die Analyse von Fettsauren oder Triacylglycerin (= TAG, AbkOrzungen in 
Ktammern angegeben) z.B. mittels Fettsauremethyiester = FAME) Gas-F^ssiokeits 
^g^^™*^^ (= GC-MS) oder LnsJ^^aCpte 

Der unzweideutige Nachweis fQr das Vorliegen von Fettsaureprodukten kann mittels 

g^gTms^ 

GC GC-MS oder TLC, w.e verschiedentlich beschrieben von Christie und den Litera- 
turstellen dann (1997, in: Advances on Lipid Methodology, Vierte Aufl ■ ChriWe Slv 

32 ^53f 169: 1998, Gaschroma ™^ 

Daszu analysierende Pflanzenmaterial kann dazu entweder durch Ultraschallbehand- 
lung Mah.en ,n der Glasmuhle, flussigen Stickstoff und Mah.en oder Ober andeTe an- 

6TAZ^ ahren ^ 9ebr ° Chen Werden " 038 Materia ' ™ rd dann anschHelTd nach 
dem Aufb echen zentnfugiert. Das Sediment wird danach in Aqua dest resuspendiert 
10 m,n bei 100»C erhitzt, auf Eis abgekuhlt und emeut zentrifugiert, gefolgf * 
von Bdrakbon in 0,5 M Schwefelsaure in Methanol mit 2 % Dimethoxypropan fur 1 Std 

Linl^ T ZU n hydr °i ySierten °'- Und ^erbindungen fuhrt, die^nsmeth jierte 
L pide ergeben. D.ese Fettsauremethyiester konnen anschlieBend in Petrolether exfra 

wcot T lC « ?r GC>Ana,ySe -ter Verwendung einer KapiHa^Ch^ 
pack, WCOT Fused SU.ca, CP-Wax-52 CB, 25 mikrom, 0,32 mm) bei einem Tempera- 
turgradienten zwischen 1 70°C und 240X fur 20 min und 5 min bei 240°C unter^orfen 
werden. Die Identitat der erhaltenen Fettsauremethyiester lessen sich unter VeZn 
dung von Standards, die aus kommerziellen Quellen erhaltlich sind (d.h. Sigma), defi- 



Be, Fettsauren, fUr die keine Standards verfOgbar sind, kann die Identitat Ober Derivati- 
sierung und anschHeRende GC-MS-Analyse gezeigt werden. Beispie.sweise wire dfe 
Lokal,s,erung von Fettsauren mit Dreifachbindung Ober GC-MS nach Derivatisierung 
m.t 4,4-D.methoxyoxazolin-Derivaten (Christie, 1998, siehe oben) gezeigt. 

b) Fettsaureanalyse in Pflanzen 
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Die Proben wurden auf einer ZEBRON-ZB-Wax-Kapillarsaule (30 m 0 32 mm 
. 0 25 m.kro m; Phenomenex) in einem Hewiett PackL-6850-GascLmalograph mit 
einem Flammen.onisationsdetektor i^^DI.Ohnl^S^ 
(1 m,n barter,) b,s 200°C mit einer Rate von 20°C/min, dann auf 250^5 min harten? 
m,t e,ner Rate von 5°C/min und schlie&iich auf 260°C mit einer Rate von™c,mT2- 
gramnuert Stack** wurde als Tragergas verwendet (4,5 mi/min bei 7o"c) D Te Fett 
l6e^Z Ver9,eiCh Retentions ^n von FAME-Standards (sIgMA^ 

Beispiel 4: Funktionelle Charakterierung der CeLPLATs in Hefe 
a ) Heterology Expression in S a ccharomvra S cerevisi«F> 

Zur Charakterisierung der Funktion der CeLPLATs aus C. elegans wurden die offenen 
Leserahmen der jeweilgen cDNAs stromabwarts des Gaiactose-induzierbaren GAL1 
Promotors von P Yes2.1Topo unter Verwendung des P Yes2.1TOPO TA e££S£ kH 
(Invtrogen) klon.ert, wobei P Yes2-T06E8.1 und P Yes2-F59F4.4 erhaiten wSroen 

Da die Expression der CeLPLATs zu einem effizienten Austausch der Acyl-Substrate 
fchren soHte, wurde weiterhin das Doppelkonstrukt P ESCLeu-PpD6-Pse1 he^rgestelrt 

° ffen D T Leserahmen einer A6-Desaturase (PpD6) und einer A6-Elonga7e 
(PSE1) aus P/,y S comffre//a patens (siehe DE 102 19 203) beinhaltet Die NuWeTnsau 
resequenz der A6-Desaturase (PpD6) und der A6-E.ongase (P^l^e^SSZn"- 
SEQ id NO: 9 und SEQ ID NO: 11 wiedergegeben. Die korrespondZnden ^ 
sauresequenzen sind SEQ ID NO: 10 und SEQ ID NO: 12 zu entnehmen 

D\e Saccharomyces cerews/ae-Stamme C13ABYS86 (Protease-deflzient) und INVSd 
wurde mrttels e.nes modifizierten PEG/Lithiumacetat-Protokol.s gleichzelg mtt den 
L~ Tpom T^ 6 T ^ P ESCLeu " P PD6-Pse1 bzw. pYes2>59F4. 4 ™SC- 
Leu-P P D6-Pse1 transformiert. Als Kontrolle wurde eine Hefe verwendet, die mit dem 

30 IT* S£f f L t eU -? D6 : PSe1 ^ d6m ,6eren Vektor > Yes2 transformiert Z S 
fSSSL TTnT leTten Hefen erf0,9te aUf K^P'ett-Minimalmedium (CMdum* 
Agarplatten m. 2% Glucose, aberohne Uracil und Leucin. Nach der Selektion wurden 

tl^T^T' T* P Yes2 - T06E 8.1/pESCLeu-P P D6-Pse1 und zwei P Yes2 
F59F4.4/pESCLeu-PpD6-Pse1 und eine P ESCLeu-PpD6-Pse1/ P Yes2 zur weiteren 

35 sssrs hit - Die beschriebenen ~ ente - ^ - 

?f ie E *P r esssion der CeLPAATs wurden zunachst Vorkulturen aus jeweils 2 ml 

»™7^ SS T edi r mit2% (W/V) Raffin0Se ' aberohne U ™> "nd Leucin mit den 
CmZ R h °T n . t6n an9eimpft Und 2 Ta 9 e ^i 30-C, 200rpm inkubtert ml 

CMdum-Fluss.gmed.um (ohne Uracil und Leucin) mit 2% Raffinose, 1% (v/v) Tergit o r 
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NP-40 und 250 jjM Linolsaure (18:2 A912 ) oder Linolensaure (18:3 A9 ' 12 ' 15 ) wurden dann 
mit den Vorkulturen auf eine OD 600 von 0,08 angeimpft. Die Expression wurde bei fciner 
OD 60 o von 0,2-0,4 durch die Zugabe von 2% (w/v) Galactose induziert. Die Kulturen 
wurden fur weitere 48 h bei 20°C inkubiert. 

5 Fettsaureanalvse 

Die Hefezellen aus den Hauptkulturen wurden durch Zentrifugation (100 x g, 10 min, 
20°C) geemtet und mit 100 mM NaHC0 3 , pH 8,0 gewaschen, um restliches Medium 
und Fettsauren zu entfemen. Aus den Hefe-Zellsedimenten wurden 
Fettsauremethyiester (FAMEs) durch saure Methanolyse hergestellt. Hierzu wurden die 

10 Zellsedimente mit 2 ml 1N methanolischer Schwefelsaure und 2% (v/v) 

Dimethoxypropan fur 1 h bei 80°C inkubiert. Die Extraktion der FAMES erfolgte durch 
zweimalige Extraktion mit Petrolether (PE). Zur Entfernung nicht derivatisierter 
Fettsauren wurden die organischen Phasen je einmal mit 2 ml 100 mM NaHC0 3 , pH 
8,0 und 2 ml Aqua dest gewaschen. AnschlieRend wurden die PE-Phasen mit Na 2 S0 4 

J 5 getrocknet, unter Argon eingedampft und in 100 pi PE aufgenommen. Die Proben 

' wurden auf einer DB-23-Kapillarsaule (30 m, 0,25 mm, 0,25 pm, Agilent) in einem 

Hewlett-Packard 6850-Gaschromatographen mit Flammenionisationsdetektor getrennt. 
Die Bedingungen fur die GLC-Analyse waren wie folgt: Die Ofentemperatur wurde von 
50°C bis 250°C mit einer Rate 5°C/min und schlielilich 10 min bei 250°C (halten) 

20 programmiert. 

20 Die Identifikation der Signale erfolgte durch Vergleiche der Retentionszeiten mit ent- 
sprechenden Fettsaurestandards (Sigma). 

Acvl-CoA Analyse 

Die Acyl-CoA-Analyse erfolgte wie bei Larson and Graham (2001; Plant Journal 25: 
1 15-125) beschrieben. 

25 Expressionsanalvse 

Figuren 2 A und B sowie 3 A und B zeigen die Fettsaureprofile von transgenen 
C13ABYS86 Hefen, die mit 18:2 A9 - 12 bzw. 18:3 A9 ' 12 ' 16 gefuttert wurden. Die gefutterten 
Substrate sind in grolien Mengen in alien transgenen Hefen nachzuweisen. Alle vier 
transgenen Hefen zeigen eine Synthese von 18:3 A6 - 9 ' 12 und 20:3 A8,11 - 14 bzw. 
30 1 8:4 A6 ' 9 ' 12 ' 15 und 20:4 A8 ' 11 ' 14 - 17 , den Produkten der A-6- Desaturase und A-6-Elongase 
Reaktionen. Dies bedeutet, dass die Gene PpD6 und Pse1 funktional exprimiert wer- 
den konnten. 

Figur 2 gibt wie oben beschrieben die Fettsaureprofile von transgenen C13ABYS86 S. 
cerews/ae-Zeilen. Die Synthese der Fettsauremethyiester erfolgte durch saure Metha- 
35 nolyse intakter Zellen, die entweder mit den Vektoren pESCLeu-PpD6-Pse1/pYes2 (A) 
oder pYes2-T06E8.1/pESCLeu-PpD6-Pse1 (B) transformiert worden waren. Die Hefen 
wurden in Minimalmedium in Gegenwart von 18:2 A9 - 12 kultiviert. AnschiieBend wurden 
die Fettsauremethyiester uber GLC analysiert. 
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In den Kontroll-Hefen, die mit den Vektoren pESCLeu-PpD6-Pse1/pYes2 transformiert 
wurden, ist der Anteil von 20:3 A8 - 11 - 14 , zu dem 18:3 A6 - 9 - 12 durch Pse1 elongiert wird, we- 
sentlich niedriger als in den Hefen, die zusatzlich die LPLAT T06E8.1 exprimieren Tat- 
sachlich konnte die Elongation von 1 8 :3 A8 - 9 - 12 und 18:4 A6A1215 durch die zusatzliche 
5 Expression von CeLPLAT (T06E8.1) um 100-150% verbessert werden (Figur 4). Diese 
signifikante ErhOhung des LCPUFA-Gehalts ist nur wie folgt zu erklaren- die exogen 
gefOtterten Fettsauren (IS^ 9 - 12 bzw. 18:3 A9 - 12 - 15 ) werden zunachst in Phospholipide 
eingebaut und dort von der A-6-Desaturase zu 18:3 A6A ? 2 und <|8:4 A6 - 9 - 12 - 15 desaturiert. 
Erst nach Reaquilibrierung mit dem Acyl-CoA-Pool kSnnen 18:3 A6 - 9 - 12 und 18-4 a6 - 9 - 12 - 1 s 
10 durch die Elongase zu 20:3 A8 - 11 - 14 - bzw. 20:4 A8 - 11 ' 14 - 17 -CoA elongiert und dann wieder in 
die Lipide eingebaut werden. Die LPLAT T06E8.1 ist in der Lage, die A6-desaturierten 
Acylgruppen sehr effizient in CoA-ThioesterzurOckzuverwandeln. Interessanterweise 
konnte auch die Elongation der gefOtterten Fettsauren 18:2 A9,12 und 18:3 A9 - 12 ' 15 verbes- 
sert werden. (Figur 2 A und B bzw. 3 A und B). 

1 5 Figur 3 gibt die Fettsaureprofile von transgenen C1 3ABYS86 S. cerev/s/ae-Zellen. Die 
Synthese der Fettsauremethylester erfolgte durch saure Methanolyse intakter Zellen, 
die entweder mit den Vektoren pESCLeu-PpD6-Pse1/pYes2 (A) oder pYes2- 
T06E8.1/pESCLeu-PpD6-Pse1 (B) transformiert worden waren. Die Hefen wurden in 
Minimalmedium in Gegenwart von 18:3 A9 - 12 - 15 kultiviert AnschlieBend wurden die Fett- 
20 sauremethylester Ober GLC analysiert. 

Die Expression einer anderen CeLPLAT (F59F4.4) hat dagegen keinen Einfluss auf die 
Elongation (Figur 4). Offenbar kodiert F59F4.4 nicht fQr eine LPLAT. Nicht jede der 
putativen LPLAT Nukleinsauresequenzen ist also enzymatisch aktiv in der erfindungs- 
gemafc gefundenen Reaktion. 

25 Figur 4 gibt die Elongation exogen applizierter 18:2 A912 bzw. 18:3 A9,121S im Anschluss 
an ihre endogene A-6-Desaturierung (Daten aus Fig. 2 und 3) wieder. Die exogen ge- 
fOtterten Fettsauren werden zunachst in Phospholipide eingebaut und dort zu 18:3 A6,9 - 12 
und 18:4 A6 912 - 15 desaturiert. Erst nach Reaquilibrierung mit dem Acyl-CoA-Pool konnen 

18:3 A6,9.12 und 18 . 4 A6,9.12,1S durch dje E , ongase ^ 2Q.3A8.ll.i4. ^ 2 0:4 A8 ' 11 ' 14 ' 17 -CoA 

30 elongiert und dann wieder in die Lipide eingebaut werden. Die LPLAT T06E8.1 ist in 
der Lage, die A-6-desaturierten Acylgruppen effizient in CoA-Thioester zurtickzuver- 
wandeln. 



Diese Ergebnisse zeigen, dass die CeLPLAT (T06E8.1) nach Co-expression mit der 
A-6-Desaturase und A-6-Elongase zu einer effizienten Produktion von C20-PUFAs 
35 fuhrt. Diese Ergebnisse sind dadurch zu erklaren, dass die CeLPLAT (T06E8. 1 ) einen 
effizienten Austausch der neusynthetisierten Fettsauren zwischen Lipiden und dem 
Acyl-CoA-Pool ermoglicht (siehe Figur 7). 

Figur 7 gibt die Acyl-CoA-Zusammensetzung transgener INVSd Hefen, die mit den 
Vektoren pESCLeu PpD6Pse1/pYes2 (A) oder pESCLeu-PpD6-Pse1/pYes2-T06E8.1 
40 (B) transformiert worden waren, wieder. Die Hefezellen wurden in Minimalmedium oh- 
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ne Uracil und Leucin in Gegenwart von 250 18:2 A9,12 kultiviert. Die Acyl-CoA- 
Derivate wurden uber HPLC analysiert. 

Bei Verwendung des Hefe-Stammes INVScl zur Co-Expression von CeLPLAT 
(T06E8.1) zusammen mit PpD6 und Pse1 ergibt sich folgendes Bild: Kontrolihefen, die 
5 PpD6 und Pse1 exprimieren, enthalten wie schon bei Verwendung des Stammes 

C13ABYS86 gezeigt nur geringe Mengen des Elongationsprodukts (20:3 A8,11 14 bei Fut- 
terung von 18:2 bzw. 20:4 A8 ' 11 ' K17 bei FQtterung von 18:3; siehe Figur 5 A und 6 A). Bei 
zusatzlicher Expression von CeLPLAT (T06E8.1) erfolgt ein deutlicher Anstieg dieser 
Elongationsprodukte (siehe Figur 5 B und 6 B). Tabelle 6 zeigt, dass die zusatzliche 
10 Expression von CeLPLAT Qberraschenderweise eine 8-fache Erhohung des Gehaltes 
an 20:3 A8 ' 11 ' 14 (bei FQtterung von 18:2) bzw. 20:4 A81 1/1417 (bei FQtterung von 18:3) be- 
wirkt. Daneben zeigt sich, dass auch C16:2 A6,9 zu C18:2 A6,9 effizienter elongiert wird. 
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Fettsaure-Zusammensetzung (in mol %) transgener Hefen, die mit den 
Vektoren pESCLeu PpD6Pse1/pYes2 (PpD6 Pse1) oder pESCLeu- 
PpD6-Pse1/pYes2-T06E8.1 (PpD6 Pse1 + T06E8) transformiert worden 
waren. Die Hefezellen wurden in Minimalmedium ohne Uracil und Leucin 
in Gegenwart von 250 pM 18:2 A9 - 12 oder 18:3 A9 ' 12 ' 15 kultiviert. Die Fett- 
sauremethylester wurden durch saure Methanolyse ganzerZellen ge- 
wonnen und uber GLC analysiert. Jeder Wert gibt den Mittelwert (n = 4) 
± Standardabweichung wieder. 



Fpktt<s£5i iron 


FQtterung mit 250 pM 

18:2 A9.12 


FQtterung mit 250 pM 

18 . 3 A9.12.15 


PpA6/Pse1 


PpA6/Pse1+ 
T06E8 


PpA6/Pse1 


PpA6/Pse1+ 
T06E8 


16:0 


15,31 + 1,36 


15,60 ±1,36 


12,20 ± 0,62 


16,25 ±1,85 


16:1 A9 


23,22 ±2,16 


15,80 ±3,92 


17,61 ±1,05 


14,58 ± 1,93 


18:0 


5,11 ±0,63 


7,98 ±1,28 


5,94 ±0,71 


. 7,52 ± 0,89 


18:1 A9 


15,09 + 0,59 


16,01 ±2,53 


15,62 ± 0,34 


15,14 ±2,61 


18:1 A11 


4,64 ±1,09 


11,80±1,12 


4,56 ±0,18 


13,07 ±1,66 


18 . 2 A9.12 


28,72 ± 3,25 


14,44 ±1,61 






18 . 3 A6.9.12 


3,77 ± 0,41 


4,72 ± 0,72 






18:3 A9.12.15 






32,86 ± 1,20 


14,14 + 2,52 


18 . 4 A 6 ,9.12.15 






5,16 ± 1,04 


3,31 ±1,15 


20:2 A1 1,14 


2,12 ±0,86 


4,95 ±4,71 






20:3 A8.11.14 


1,03 ±0,14 


8,23 ±1,59 






20:3^11.14,17 






4,12 ± 1,54 


6,95 ± 2,52 


2Q.4A8,11.14,17 






1,34 ±0,28 


8,70 ±1,11 



Figur 5 ist das Fettsaure-Profile von transgenen INVSd S. cerevisiae-Zellen zu ent- 
nehmen. Die Synthese der Fettsauremethylester erfolgte durch saure Methanolyse 
intakter Zellen, die entweder mit den Vektoren pESCLeu-PpD6-Pse1/pYes2 (A) oder 
P Yes2-T06E8.1/pESCLeu-PpD6-Pse1 (B) transformiert worden waren. Die Hefen wu 
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den in Minimalmedium in Gegenwart von 18:2 A9 - 12 kultiviert Anschliefiend wurden die 
Fettsauremethylester iiber GLC analysiert. 

Figur 6 gibt die Fettsaure-Profile von transgenen INVSd S. cerews/ae-Zellen wieder 
Die Synthese der Fettsauremethylester erfolgte durch saure Methanolyse intakter Zel- 
len. die entweder mit den Vektoren pESCLeu-PpD6-Pse1/pYes2 (A) Oder P Yes2- 
T06E8.1/pESCLeu-PpD6-Pse1 (B) transformiert worden waren. Die Hefen wurden in 
Minimalmedium in Gegenwart von 18:3 A ' 12 - 15 kultiviert. Anschlieftend wurden die Fett- 
sauremethylester Ober GLC analysiert. 

Ein Mali fur die Effizienz der LCPUFA-Biosynthese in transgener Hefe stellt der Quo- 
tent f, S ehalt der erwunsc nte" A-6-Elongationsprodukt nach A-6-Desaturierunq 
(20: d'5 bZW ' 20:4A8,11 ' 14 ' 17 > Gehalt an zugefutterter Fettsaure (18:2 A9 < 2 bzw 
18:3 • • ) dar. Dieser Quotient betragt 0,04 in INVSd Kontrollhefen, die PpD6 und 
Pse1 expnmieren, und 0,60 in Hefen die zusatzlich zu PpD6 und Pse1 CeLPLAT 
exprimieren. In anderen Worten: der Gehalt an erwunschtem A-6-Elongationsprodukt 
nach A-6-Desaturierung bei Co-Expression von CeLPLAT betragt 60% des Gehalts der 
jeweils zugefutterten Fettsaure. In Kontrollhefen betragt dieser Gehalt nur ca. 4% Dies 
bedeutet eine 15-fache Erhohung der Effizienz der LCPUFA-Biosynthese in transgener 
Hefe durch Co-Expression von LPLAT. 

Interessanterweise bewirkt die Co-Expression von CeLPLAT nicht nur eine Erhohung 
dergenannten Elongationsprodukte 20:3 A811 > 14 bzw. 20:4 A8 - 11 - 14 - 17 , sondern auch eine 
Erhohung des Verhaltnisses 20:3 A8 - 11 - 14 : 20:2 AU14 bzw. 20:4 A8,11 - 14>17 : 20:3 A11>14 - 17 Dies 
bedeutet, dass in Anwesenheit der LPLAT die A-6-Elongase bevorzugt mehrfach un- 
gesattigte Fettsauren (18:3 A6 - 9 - 12 und 18:4 A6 - 9 - 12 - 15 ) ais Substrat verwendet, wahrend bei 
Abwesenheit der LPLAT keine ausgepragte Substratspezifitat zu erkennen ist (auch 
18:2 ■ und 18:3 A • 215 werden elongiert). Grund hierfOr konnen Protein-Protein- 
Wechselwirkungen zwischen A-6-Elongase, A-6-Desturase und LPLAT oder posttrans- 
lationale Modifikationen (z.B. partielle Proteolyse) sein. Dies wurde auch erklaren, wa- 
rum der oben beschriebene Anstieg von A-6-Elongationsprodukten bei Co-Expression 
von A-6-Desaturase, A-6-Elongase und LPLAT bei Verwendung eines protease- 
defizienten Hefestamms geringer ausfailt. 

Acyl-CoA Analysen von transgenen INVSd Hefen, die mit 18:2 A9 -- 12 gefuttert wurden 
0rga !fo n J Oi9endes Er 9 ebnis : Kontrollhefen, die PpD6 und Pse1 exprimieren, ist kein 
18:3 A6,9.i 2 _ CoA und 20 :3 A8 - 1 ^ 4 -CoA nachweisbar. Dies weist darauf hin, dass weder 
das Substrat (18:3 A6 - 9 - 12 -CoA) noch das Produkt (20:3 A8 ' 11 - 14 -CoA) der A-6-Elongase in 
Kontrollhefen in nachweisbaren Mengen vorhanden ist. Dies lasst darauf schlieBen 
das der Transfer von 1 8:3 A6A12 aus Membranlipiden in den Acyl-CoA Pool nicht Oder 
nicht richtig stattfindet Das bedeutet, dass kaum Substrat fOr die vorhandene A-6- 
Elongase zur Verfugung steht, was wiederum den gerlngen Gehalt an Elongationspro- 
dukt in Kontrollhefen erklart. INVSd Hefen, die zusatzlich zur PpD6 und Pse1 die 
CeLPLAT exprimieren und mit IS:^ 9 - 12 gefuttert worden waren, weisen keine signifi- 
kanten Mengen an 18:3 A6912 -CoA auf, wohl aber 20:3 A811 ' 14 -CoA. Dies deutet darauf 
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hin, dass LPLAT sehr effizient 18:3 A6A12 aus den Membranlipiden in den Acyl-CoA- 
Pool uberfuhrt. 18:3 A6 - 912 -CoA wird dann von der A-6-Elongase elongiert, so dass kein 
1 8:3 A6 - 9 - 12 -CoA, wohl aber 20:3 A8 - 11 ' 14 -CoA nachweisbar ist. 

b) Funktionelle Charakterierung der CeLPLATs in transgenen Pflanzen 
Expression funktionaler CeLPLAT in transqenen Pflanzen 

In DE 102 19 203 wurden transgene Pflanzen beschrieben, deren Samenol durch sa- 
menspezifische Expression funktioneller Gene kodierend fOr A-6-Desaturase, A-6- 
Elongase und A-5-Desaturase geringe Mengen an ARA und EPA enthalt Der zur 
Transformation dieser Pflanzen benutzte Vektor ist SEQ ID NO: 19 zu entnehmen. Um 
den Gehalt an diesen LCPUFAs zu erhbhen, wurde in den genannten transgenen 
Pflanzen zusatzlich das Gen CeLPLAT (T06E8. 1) in Samen exprimiert. 

Zu diesem Zweck wurde der kodierende Bereich von CeLPLAT uber PCR amplifiziert. 

In Tabelle 6 sind die Primer wiedergegeben, die zur Klonierung eines weiteren Clones 
der ceLPLAT in binare Vektoren verwendet wurden. 



Tabelle 6: Nukleotidsequenzen der PCR-Primer zur Klonierung von CeLPLAT 
(T06E8. 1 ) in den binaren Vektor pSUN3 



Primer 


Nukleotidsequenz 


ARe503f* 


5' TTAAGCGCGGCCGCATGGAGAACTTCTGGTCG 3' 


ARe504r* 
* t. * i 


5' ACCTCGGCGGCCGCCCTTTTACTCAGATTTC 3* 



* f: forward, r. reverse 



Das PCR-Produkt wurde in einen pENTRY Vektor zwischen USP Promotor und OCS- 
Terminator kloniert. Anschliefiend wurde die Expressionskassette in die binaren Vekto- 
ren pSUN300 kloniert. Der entstandene Vektor wurde mit pSUN3CeLPLAT (Figur 8) 
bezeichnet. Daruber hinaus wurde der kodierende Bereiche von CeLPLAT amplifiziert 
und zwischen LegB4 Promotor und OCS-Terminator kloniert. Dieser Vektor wurde mit 
pGPTVCeLPLAT bezeichnet (Figur 9A). 

DarUberhinaus wurde der kodierende Bereich von CeLPLAT uber PCR amplifiziert und 
zwischen LegB4 Promotor und OCS-Terminator kloniert Die hierfQr verwendeten PCR 
Primer wurden so ausgewahlt, dass in das PCR-Produkt eine effiziente Kosaksequenz 
eingefuhrt wurde. AuBerdem wurde die DNA-Sequenz von CeLPLAT so verandert, 
dass sie der codon usage von heheren Pflanzen angepasst war. 
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Folgende Primer wurden fiir die PCR verwendet: 

Forward primer 5'-ACATAATGGAGAACTTCTGGTCTATTGTTGTGTTTTTTCTA-3' 

Reverse primer 5'- CTAGCTAGCTTACTCAGATTTCTTCCCGTCTTTTGTTTCTC-3' 

Das PCR Produkt wurde in den Klonierungsvektor pCR Script kioniert und Ciber die 
5 Restriktionsenzyme Xmal und Sad in den Vektor pGPTV LegB4-700 kioniert. Das ent- 
standene Plasmid wurde mit pGPTV LegB4-700 + T06E8.1 bezeichnet (Figur 9A). 

Das gleiche PCR Produkt wurde daruber hinaus in einen Multigen-Expressionsvektor 
kioniert, der bereits die Gene fiir eine Delta-6-Desaturase aus Phaeodactylum tricornu- 
tum (SEQ ID NO: 32, Aminosauresequenz SEQ ID NO: 33) und einer Delta-6- 
10 Elongase aus P. patens enthielt. Das entstandene Plasmid wurde mit pGPTV 

USP/OCS-1,2,3 PSE1(Pp)+D6-Des(Pt)+2AT (T06E8-1) bezeichnet (Figur 9B). Die 
Sequenzen des Vektors sowie der Gene sind SEQ ID NO:.34, SEQ ID NO: 35, SEQ ID 

• NO: 36 und SEQ ID NO: 37 zu entnehmen. Die A-6-Desaturase aus Phaeodactylum 
tricornutum reicht von Nukleotid 4554 bis 5987 in der SEQ ID NO: 34. Die A-6- 
15 Elongase aus Physcomitrella patens reicht von Nukleotid 1026 bis 1898 und die der 
LPLAT aus Caenorhabditis elegans reicht von Nukleotid 2805 bis 3653 in der SEQ ID 
NO: 34. 

Tabakpflanzen wurden co-transformiert mit dem Vektor pSUN3Cel_PLAT und dem in 
DE 102 19 203 und SEQ ID NO: 19 beschriebenen Vektor enthaltend Gene kodierend 
20 fur A-6-Desaturase, A-6-Elongase und A-5-Desaturase, wobei die Selektion transgener 
Pflanzen mit Kanamycin erfolgte. 

Tabakpflanzen wurden auBerdem transformiert mit dem Vektor pGPTV USP/OCS- 
1,2,3 PSE1(Pp)+D6-Des(Pt)+2AT (T06E8-1) [siehe SEQ ID NO:.34, SEQ ID NO: 35, 
SEQ ID NO: 36 und SEQ ID NO: 37]. 

•25 Lein wurde mit dem Vektor pSUN3CeLPLAT transformiert. Die entstandenen transge- 
nen Pflanzen wurden mit solchen transgenen Leinpflanzen gekreuzt, die bereits gerin- 
ge Mengen an ARA und EPA aufgrund der funktionellen Genexpression von A-6- 
Desaturase, A-6-Elongase und A-5-Desaturase enthielten. 

Weiterhin wurde Lein mit dem Vektor pGPTV LegB4-700 + T06E8.1 transformiert. Die 
30 entstandenen transgenen Pflanzen wurden mit solchen transgenen Leinpflanzen ge- 
kreuzt, die bereits geringe Mengen an ARA und EPA aufgrund der funktionellen Ex- 
pression von A-6-Desaturase, A-6-Elongase und A-5-Desaturase enthielten. 

Die Samen von transgenen Tabak- und Leinpflanzen wurden wie weiter vorne be- 
schrieben [Beispiel 3 b)] auf erhohte Gehalte an LCPUFAs in untersucht. 

35 Aus den hier vorliegenden Arbeiten lasst sich die Funktion der Acyl-CoA:Lyso- 

phophoiipid-Acyltranserase (LPLAT) wie in Figur 10 dargestellt ableiten. Der Biosyn- 
these-Weg der LCPUFAS stellt sich damit wie folgt dar. 
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Desaturasen katalysieren die Einfuhrung von Doppelbindungen in lipidgekoppelte Fett- 
sauren (sn2-Acyl-Phosphatidyicholin), wahrend die Elongasen exklusiv die Elongation 
Coenzym A-veresterter Fettsauren (Acyl-CoAs) katalysieren. Nach diesem Mechanis- 
mus erfordert die alternierende Wirkung von Desaturasen und Elongasen einen standi- 
gen Austausch von Acyl-Substraten zwischen Phospholipiden und Acyl-CoA-Pool und 
somit die Existenz einer zusatzlichen Aktivitat, die die Acyl-Substrate in die jeweils 
notwendige Substratfonm, d.h. Lipide (fDr Desaturasen) oder CoA-Thioester (fur Elon- 
gasen), QberfQhrt Dieser Austausch zwischen Acyl-CoA Pool und Phospholipiden wird 
durch LCPUFA-spezifische LPLAT ermoglicht Die Biosynthese von ARA (A) erfolgt 
analog zu EPA (B), mit dem Unterschied, dass bei EPA der A-6-Desaturierung eine A- 
15-Desaturierung vorgeschaltet ist, so dass a18:3-PC als Substrat fOr die A-6- 
Desaturase fungiert. Die Biosynthese von DHA macht einen weiteren Austausch zwi- 
schen Phospholipiden und Acyl-CoA-Pool Ciber LPLAT notwendig: 20:5 A5A11 - 14 - 17 wird 
vom Phospholipid- zum CoA-Pool transferiert und nach erfolgter A-5-Elongation wird 
22:507.10,13.16.19 vom CoA _ 2um phospholipid-Pool transferiert und schlieBlich durch A-4- 
Desaturase zu DHA umgesetzt. Gleiches gilt fur den Austausch im Biosyntheseweg 
unter Verwendung der A-8-Desaturase, der A-9-Elongase und der A-5-Desaturase. 

Aquivalente 

Der Fachmann erkennt oder kann viele Aquivalente der hier beschriebenen erfin- 
dungsgemaiien spezifischen Ausfuhrungsformen feststellen, indem er lediglich Routi- 
neexperimente verwendet. Diese Aquivalente sollen von den Patentanspruchen um- 
fasst sein. 
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Verfahren zur Herstellung mehrfach ungesattigter Fettsauren 
Zusammenfassung 

Die vorliegende Erfindung betrifft ein Verfahren zur Herstellung von mehrfach ungesat- 
tigten Fettsauren in einem Organismus indem Nukleinsauren in den Organismus ein- 
gebracht werden, die fur Polypeptide mit Acyl-CoA:Lysophospholipid-Acyltrans- 
feraseaktivitat codieren. Vorteilhaft konnen diese Nukleinsauresequenzen gegebenen- 
falls zusammen mit weiteren Nukleinsauresequenzen, die fur Polypeptide der Biosyn- 
these des Fettsaure- Oder Lipidstoffwechels codieren, in dem transgenen Organismus 
exprimiert werden. 

Die Erfindung betrifft weiterhin die Nukleinsauresequenzen, Nukleinsaurekonstrukte 
enthaltend die erfindungsgemalien Nukleinsauresequenzen, Vektoren enthaltend die 
Nukleinsauresequenzen und/oder die Nukleinsaurekonstrukte sowie transgene Orga- 
nismen enthalten die vorgenannten Nukleinsauresequenzen, Nukleinsaurekonstrukte 
und/oder Vektoren. 

Ein weiterer Teil der Erfindung betrifft Ole, Lipide und/oder Fettsauren hergestellt nach 
dem erfindungsgernafien Verfahren und deren Verwendung. 
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10 



15 



20 




35 



40 




50 



55 



60 



SEQUENCE LISTING 

<110> BASF Plant Science GmbH 

<120> Verfahren zur Herstellung mehrfach ungesattigter Fettsauren 

<130> 20030015 

<160> 37 

<170> Patentln version 3.1 

<210> 1 

<211> 849 

<212> DNA 

<213> Caenorhabditis elegans 
<220> 

<221> CDS 

<222> (1)..(849) 

<2 2 3 > Acyl-CoA : Ly sophospho 1 ipid-Acyl trans f eras e 



<400> 1 

atg gag aac ttc tgg teg ate gtc gtg ttt ttt eta etc tea att etc 
Met Glu Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He Leu 
15 10 15 

ttc att tta tat aac ata teg aca gta tgc cac tac tat atg egg att 

60 Phe He Leu Tyr Asn He Ser Thr Val Cys His Tyr Tyr Met Arg He 

20 25 30 



48 



96 



teg ttt tat tac ttc aca att tta ttg cat gga atg gaa gtt tgt gtt 
Ser Phe Tyr Tyr Phe Thr He Leu Leu His Gly Met Glu Val Cys Val 
35 40 45 

aca atg ate cct tct tgg eta aat ggg aag ggt get gat tac gtg ttt 
Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 
50 55 60 

cac teg ttt ttc tat tgg- tgt aaa tgg act ggt gtt cat aca aca gtc 
His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 
65 70 75 80 

tat gga tat gaa aaa aca caa gtt gaa ggt ccg get gta gtt att tgt 
Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
85 90 95 

aat cat cag agt tct etc gac att eta teg atg gca tea ate tgg ccg 
Asn His Gin Ser Ser Leu Asp He Leu Ser Met Ala Ser He Trp Pro 
100 105 no 

aag aat tgt gtt gta atg atg aaa cga att ctt gee tat gtt cca ttc 
Lys Asn Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro Phe 
115 120 125 

ttc aat etc gga gee tac ttt tec aac aca ate ttc ate gat cga tat 
Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe He Asp Arg Tyr 
130 135 140 

aac cgt gaa cgt gcg atg get tea gtt gat tat tgt gca tct gaa atg 
Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 



144 



192 



240 



288 



336 



384 



432 



480 
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145 150 155 160 

aag aac aga aat ctt aaa ctt tgg gta ttt ccg gaa gga aca aga aat 
Lys Asn Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 
165 170 175 

cgt gaa gga ggg ttc att cca ttc aag aaa gga gca ttc aa~t att gca 
Arg Glu Gly Gly Phe lie Pro Phe Lys Lys Gly Ala Phe Asn He Ala 
180 185 190 

gtt cgt gcg cag att ccc att att cca gtt gta ttc tea gac tat egg 
Val Arg Ala Gin He Pro He He Pro Val Val Phe Ser Asp Tyr Arg 
195 200 205 

gat ttc tac tea aag cca ggc cga tat ttc aag aat gat gga gaa gtt 
Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
210 215 220 

gtt att cga gtt ctg gat gcg att cca aca aaa ggg etc act ctt gat 
Val He Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 
225 230 235 240 

gac gtc age gag ttg tct gat atg tgt egg gac gtt atg ttg gca gee 
Asp Val Ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
245 250 255 

tat aag gaa gtt act eta gaa get cag caa cga aat gcg aca egg cgt 
Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Arg 
260 265 270 

gga gaa aca aaa gac ggg aag aaa tct gag taa 
Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 



<210> 2 
<211> 282 
<212> PRT 

<213> Caenorhabditis elegans 
<400> 2 

Met Glu Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He Leu 
15 10 15 



Phe He Leu Tyr Asn He Ser Thr Val Cys His Tyr Tyr Met Arg He 
20 25 30 



Ser Phe Tyr Tyr Phe Thr He Leu Leu His Gly Met Glu Val Cys Val 
35 40 45 



Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 
50 55 60 



His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 
65 70 75 80 



BASF Plant Science GmbH 



20030015 



PF 54305 DE 




3 

Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
85 90 95 

5 Asn His Gin Ser Ser Leu Asp He Leu Ser Met Ala Ser He Trp Pro 
iuu 105 110 

10 ^ S Met ' LYS *"» Ile LeU Ala f val ^o Phe 

120 125 

Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe lie Asp Arg Tyr 
•J5 J * w 135 140 

Asn Arg Glu Arg Ala Me.t Ala Ser Val Asp Tyr Cys Ala Ser. Glu Met 

150 15 S 160 

20 

Lys Asn Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 
165 I? 0 175 

25 Arg Glu Gly Gly Phe lie Pro Phe Lys Lys Gly Ala Phe Asn He Ala 



180 185 



190 



3q Val Arg Ala Gin He Pro He He Pro Val Val Phe Ser Asp Tyr Arg 

Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
35 215 220 

Val He Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 

235 240 



40 




Asp Val ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu A ia Ala 
5 250 255 



45 Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Arg 



50 



Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 



270 



<210> 3 

<211> 849 

55 <212> DNA 

<213> Caenorhabditis elegans 

<220> 

<221> CDS 

60 <222> (1)..(849) 

<223> Acyl-CoA: Lysophospholipid-Acyltransferase 
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<400> 3 

atg gag aac ttc tgg teg ate gtc gtg ttt ttt eta etc tea att etc 
Met Glu Asn Phe Trp Ser lie Val val Phe Phe Leu Leu Ser He Leu 
1 5 10 15 

SS! t?! r tta r C ata tCg aCa gta tgc cac tac tat atg egg att 

Phe He Leu Tyr Asn u. Ser Thr Val Cys His Tyr Tyr Me? a?J zll 

^° 25 30 

teg ttt tat tac ttc aca att tta ttg cat gga atg gaa gtt tat att 
Ser Phe Tyr Tyr Phe Thr He Leu Leu His Sly Me? Su £J gs vS 



45 



^ ^ C ~* ^ Ct tgsr cta aat a *g SBt get gat tac gtg ttt 

Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 



60 



cac teg ttt ttc tat tgg tgt aaa tgg act ggt gtt cat aca aca gtc 
His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr tS ?£ 



75 



80 



tat gga tat gaa aaa aca caa gtt gaa ggt ccg get gta gtt att tot 
Tyr Gly Tyr Glu Lys Thr Gin Val Glu G?y Pr? Ala vtl vlt xlt SS 
85 90 95 

aat cat cag agt tct etc gac att cta teg atg gca tea ate tgg ccg 
Asn his Gin Ser Ser Leu Asp He Leu Ser Met Ala Ser lie Tr? P^o 
100 105 11Q 

aag aat tgt gtt gta atg atg aaa cga att ctt gee tat gtt oca ttc 
Lys Asn Cys Val Val Met Met Lys Arg lie Leu Ila Tyr Val Pro Pne 
115 120 125 

ttc aat etc gga gee tac ttt tec aac aca ate tte ate gat cga tat 
Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe He Asp A?g Tyr 
. 135 140 



aac cgt gaa cgt gcg atg get tea gtt gat tat tgt gca tct gaa atg 
Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr. Cys La Ser Me? 
145 250 155 iso 



aag aac aga aat ctt aaa ctt tgg gta tct ccg gaa gga aca aoa aat 
Lys Asn Arg Asn Leu Lys Leu Trp Val Ser Pr? £u Tnr Sg Itn 

165 170 175 

aS 2?* CCa ttC aag aaa gsa * ca ttc aat att gca 

Arg Glu Gly Gly Phe He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 



180 185 



190 



gtt cgt gcg cag att ccc att att cca gtt gta ttc tea aac tat ™ 
val Arg Ala Gin He Pro He He Pro Si Sal Pne Ser Sp Tyr Arg 

195 200 



205 



^° £f C Mg ° Ca ggC ° ga tat ttc aa * aat e** 99* gtt 

Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu 55 

ZX[J 21 5 220 

gtt att cga gtt ctg gat gcg att cca aca aaa ago etc act ctt m + 
Val Xle Arg Val Leu Asp Ala He Pro Thr Lys lly Leu Sr Leu Sp 
225 230 235 240 



48 



96 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 
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gac gtc age gag ttg tct gat atg tat caa crac crtt- 

v,! s„ olu s sec Me ? « s j~ ■» « ? « K S 

250 255 
5 tat aag gaa gtt act eta gaa act caa eaa 

*r «. oiu jjj ^ I >u s s s s £ S ESS 816 

265 270 

1H ??* 2?* ^ ga ° ggg aag aaa tct W taa 

10 Gly Olu Thr Lys Asp Gly Lys i,y S Ser GJ * 

275 280 



<210> 4 

15 <211> 282 

<212> PRT 

<213> Caenorhabditis elegans 



20 




40 



* 



<400> 4 



Met Glu Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He 
A 5 10 



Leu 

15 



25 Phe He Leu Tyr Asn He Ser Thr Val Cys His Tyr Tyr Met Arg He 
20 2 5 30 

30 PhS ^ ^e Thr He Leu Leu His Gly Met Glu Val Cys Val 

Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 



His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 

Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
85 9° 95 



5 Asn His Gin Ser ser Leu Asp He Leu Ser Met Ala 
Lys Asn Cys ' 

50 115 120 us 



ioo 105 ser 5; Trp Pro 

Lys Asn Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro Phe 



Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe He Asp Arg Tyr 
55 140 



849 



Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 

15° 155 1S0 

60 

Lys Asn Arg Asn Leu Lys Leu Trp Val Ser Pro Glu Gly Thr Arg Asn 

170 175 
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Arg Glu Gly Gly Phe lie Pro Phe Lys Lys Gly Ala Phe Asn lie Ala 
180 185 190 

5 

Val Arg Ala Gin lie Pro He He Pro Val Val Phe Ser Asp Tyr Arg 
195 200 205 

10 

Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
210 215 220 

15 Val He Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 
225 230 235 240 

Asp Val Ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
20 245 250 255 




25 



30 



35 



40 




50 



Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Arg 
260 265 270 

Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 

<210> 5 
<211> 849 
<212> DNA 

<213> Caenorhabditis elegans 

<220> 

<221> CDS 

<222> (1) . . (849) 

<223> Acyl-CoA: Lysophospholipid-Acyl transferase 
<400> 5 

atg gag aac ttc tgg teg ate gtc gtg ttt ttt eta etc tea att etc 48 
Met Glu Asn Phe Trp Ser He Val Val Phe. Phe Leu Leu Ser He Leu 
1 5 10 15. 

ttc att tta tat aac ata teg aca gta tgc cac tac tat gtg egg att 96 
Phe He Leu Tyr Asn He Ser Thr Val Cys His Tyr Tyr Val Arg He 
20 25 - 30 

teg ttt tat tac ttc aca att tta ttg cat gga atg gaa gtt tgt gtt 144 
Ser Phe Tyr Tyr Phe Thr lie Leu Leu His Gly Met Glu Val Cys Val 
35 40 45 



55 aca atg ate cct tct tgg eta aat ggg aag ggt get gat tac gtg ttt 192 
Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 
50 55 60 

cac teg ttt ttc tat tgg tgt aaa tgg act ggt gtt cat aca aca gtc 240 
60 His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 
65 70 75 80 
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tat gga tat gaa aaa aca caa gtt gaa ggt ccg get gta gtt att tgt 
Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val lie Cys 
85 90 95 



288 



aat cat cag agt tct - etc gac att eta teg atg gca tea ate tgg ccg 
Asn His Gin Ser Ser Leu Asp lie Leu Ser Met Ala Ser lie Trp Pro 
100 105 110 



336 



aag aat tgt gtt gta atg atg aaa cga att ctt gee tat gtt cca ttc 
10 Lys Asn Cys Val Val Met Met Lys Arg lie Leu Ala Tyr Val Pro Phe 
115 120 125 



384 



15 



ttc aat etc gga gee tac ttt tec aac aca ate ttc ate gat cga tat 
Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr lie Phe lie Asp Arg Tyr 
130 135 140 



432 



20 



25 



aac cgt gaa cgt gcg atg get tea gtt gat tat tgt gca tct gaa atg 480 

Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 
145 150' 155 160 

aag aac aga aat ctt aaa ctt tgg gta ttt ccg gaa gga aca aga aat 528 

Lys Asn Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 

165 170 175 

cgt gaa gga ggg ttc att cca ttc aag aaa gga gca ttc aat att gca 576 

Arg Glu Gly Gly Phe lie Pro Phe Lys Lys Gly Ala Phe Asn lie Ala 
180 185 190 



gtt cgt gcg cag att ccc att att cca gtt gta ttc tea gac tat egg 
30 Val Arg Ala Gin lie Pro lie lie Pro Val Val Phe Ser Asp Tyr Arg 
195 200 205 - 



624 



35 



gat ttc tac tea aag cca ggc cga tat ttc aag aat gat gga gaa gtt 
Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
210 215 220 



672 



40 



gtt att cga gtt ctg gat gcg att cca aca aaa ggg etc act ctt gat 720 
Val lie Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 
225 230 235 240 

gac gtc age gag ttg tct gat atg tgt egg gac gtt atg ttg gca gee 768 
Asp Val Ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
245 250 255 



tat aag gaa gtt act eta gaa get cag caa cga aat gcg aca egg cgt 
Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Arg 
260 265 270 



816 



gga gaa aca aaa gac ggg aag aaa tct gag taa 
50 Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 



849 



55 



<210> 
<211> 



6 

282 



<212> PRT 

<213> Caenorhabditis elegans 



60 



<400> 6 

Met Glu Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He Leu 
1 5 10 15 
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Phe He Leu Tyr Asn He Ser Thr Val Cys His 



20 



25 



Tyr Tyr Val Arg He 
30 



Ser Phe Tyr Tyr Phe Thr He Leu Leu His Gly Met Glu Val Cys Val 



40 



45 



10 



Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 



15 His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 
65 70 75 80 




20 



25 



30 



Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
8 5 



90 



95 



Asn His Gin Ser Ser Leu Asp He Leu Ser Met Ala Ser He Trp Pro 
100 105 110 

Lys Asn Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro Phe 
115 120 125 

Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe He Asp Arg Tyr 
130 135 x " ■* 



140 



35 Asn Arg Glu Arg Ala 



- , , Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 

145 I 50 155 leo 



40 



Lys Asn Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 



165 



170 



175 




Arg Glu Gly Gly Phe He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 
I 80 185 190 

Val Arg Ala Gin He Pro He He Pro Val Val Phe Ser Asp Tyr Arg 
195 200 205 



50 



Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
210 215 220 

55 Val He Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 



230 



235 



240 



Asp val ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
U 245 250 255 
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Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Arg 
260 265 270 

5 Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 

<210> 7 
10 <211> 849 
<212> DNA 

<213> Caenorhabditis elegans 

<220> 
15 <221> CDS 

<222> (1)..(849) 

<223> Acyl-CoA: Lys ophospho lipid- Acyl transferase 
20 <400> 7 

atg gag aac ttc tgg teg ate gtc gtg ttt ttt eta etc tea att etc 48 
Met Glu Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He Leu 
15 10 15 

25 ttc att tta tat aac ata teg aca gta tgc cac tac tat atg egg att 96 
Phe He Leu Tyr Asn He Ser Thr Val Cys His Tyr Tyr Met Arg He 
20 25 '30. 

teg ttt tat tac ttc aca att tta ttg cat gga atg gaa gtt tgt gtt 144 
30 Ser Phe Tyr Tyr Phe Thr He Leu Leu His Gly Met Glu Val Cys Val 
35 40 45 

aca atg ate cct tct tgg eta aat ggg aag ggt get gat tac gtg ttt 192 
Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 
35 50 55 60 



40 



cac teg ttt ttc tat tgg tgt aaa tgg act ggt gtt cat aca aca gtc 240 
His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 
65 70 75 80 

tat gga tat gaa aaa aca caa gtt gaa ggt ccg gcc gta gtt att tgt 288 
Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
85 90 95 

aat cat cag ggt tct etc gac att eta teg atg gca tea ate tgg ccg 33 6 

Asn His Gin Gly Ser Leu Asp He Leu Ser Met Ala Ser He Trp Pro 
100 105 110 

aag aat tgt gtt gta atg atg aaa cga att ctt gcc tat gtt cca ttc 384 
50 Lys Asn Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro Phe 
115 120 125 

ttc aat etc gga gcc tac ttt tec aac aca ate ttc ate gat cga tat 432 
Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe He Asp Arg Tyr 
55 130 135 140 



60 



aac cgt gaa cgt gcg atg get tea gtt gat tat tgt gca tct gaa atg 480 
Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 
145 150 155 160 

aag aac aga aat ctt aaa ctt tgg gta ttt ccg gaa gga aca aga aat 528 
Lys Asn Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 
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"5 170 175 

cgt gaa gga ggg ttc att cca ttc aag aaa gga gca ttc aat att err-* „ c 
Arg Glu Gly Gly Phe He Pro Phe Lys Lys §Iy La Phe £J £J Sa 576 
180 185 190 

gtt cgt gcg cag att ccc att att cca gtt ata ttc tea m p «- =< - „ 
Val Arg Ala Gin Xle Pro lie Ile Pro !2 S £ Ser Tyr 2J 



672 



720 



768 



816 



200 205 

? at ^° rl aC tCa aag CCa ggc caa tat ttc aag aat gat gga aaa att 
Asp ?he Tyr Ser L ys Pro Gly Arg Tyr Phe Lys Asn Lp Sy SE SS 

215 220 

va^ ?S ?f ? a ' g f 3 3tt CCa aca aaa ctc «t ctt gat 

Val lie Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 

225 230 235 240 

So v£ £ SS r ttg « Ct ? at tgt Cgg gaC gtt ata ^ a gec 

Asp Val ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 

245 250 255 

tat aag gaa gtt act eta gaa get cag caa cga aat oca aca Pm ™<- 

*** ^ 2£ LSU G1U Ala G1 » Gln *S I- S J£ S Arg" 

260 265 .270 

gga gaa aca aaa gac ggg aag aaa tct gag taa 
Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 

<210> 8 
<211> 282 
<212> PRT 

<213> Caenorhabditis elegans 
<400> 8 

Met Glu Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He Leu 
5 10 15 

Phe lie Leu Tyr Asn lie Ser Thr Val Cys His Tyr Tyr Met Arg He 

25 30 

Ser Phe Tyr Tyr Phe Thr He Leu Leu His Gly Met Glu Val Cys Val 
35 40 45 

Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 

55 60 

His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 

Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
85 90 95 
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Asn His Gin Gly Ser Leu Asp lie Leu Ser Met Ala Ser lie Trp Pro 
100 105 . no 

Lys Asn Cys Val Val Met Met Lys Arg lie Leu Ala Tyr Val Pro Phe 
115 120 125 

Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe He Asp Arg Tyr 
130 - 135 140 

Asn Arg Glu Arg Ala Met' Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 
145 150 155 leo 

Lys Asn Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 
165 170 175 

Arg Glu Gly Gly Phe. He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 
180 185 iso 

Val Arg Ala Gin He Pro He He Pro Val Val Phe Ser Asp Tyr Arg 
195 200 205 

Asp Phe Tyr Ser Lys. Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
210 215 220 

Val He Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 
225 230 235 240 

Asp Val Ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
245 250 255 

Tyr Lys Glu Val Thr Leu Glu Ala Gin' Gin Arg Asn Ala Thr Arg Arg 
260 265 270 

Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
275 280 



<210> 9 

<211> 1578 

<212> DNA 

<213> Physcomitrella patens 

<220> 

<221> CDS 

<222> (1)..(1578) 

<223> Delta-6-Desaturase 



<400> 



9 



atg gta ttc gcg ggc ggt gga ctt cag cag ggc tct etc gaa gaa aac 
Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
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1 5 10 15 

ate gac gtc gag cac att gec agt atg tct etc ttc age gac ttc ttc 
lie Asp Val Glu His lie Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 
20 25 30 

agt tat gtg tct tea act gtt ggt teg tgg age gta cac agt ata caa 
Ser -Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin 
35 40 45 

cct ttg aag cgc ctg acg agt aag aag cgt gtt teg gaa age get gee 
Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 55- 60 

gtg caa tgt ata tea get gaa gtt cag aga aat teg agt ace cag gga 
Val Gin Cys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
65 70 75' 80 

act gcg gag gca etc gca gaa tea gtc gtg aag ccc acg aga cga agg 
Thr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg 

85 90 . ' 95 

tea tct cag tgg aag aag teg aca cac ccc eta tea gaa gta gca gta 
Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
100 105 HO 

cac aac aag cca age gat tgc tgg att gtt gta aaa aac aag gtg tat 
His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn Lys Val Tyr 
115 120 125 

gat gtt tec aat ttt gcg gac gag cat ccc gga gga tea gtt att agt 
Asp Val Ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val He Ser 
130 135 140 

act tat ttt gga cga gac ggc aca gat gtt ttc tct agt ttt cat gca 
Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 
145 150 155 160 

get tct aca tgg aaa att ctt caa gac ttt tac att ggt gac gtg gag 
Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 175 

agg gtg gag ccg act cca gag ctg ctg aaa gat ttc cga gaa atg aga 
Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 185 190 

get ctt ttc ctg agg gag caa ctt ttc aaa agt teg aaa ttg tac tat 
Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
195 200 205 

gtt atg aag ctg etc acg aat gtt get att ttt get gcg age att gca 
Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 215 220 

ata ata tgt tgg age aag act att tea gcg gtt ttg get tea get tgt 
He He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 
225 230 235 240 

atg atg get ctg tgt ttc caa cag tgc gga tgg eta tec cat gat ttt 
Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 
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etc cac aat cag gtg ttt gag aca cgc tgg ctt aat gaa gtt gtc ggg 
Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
260 265 270 

tat gtg ate ggc aac gec gtt ctg ggg ttt agt aca ggg tgg tgg aag 
Tyr Val He Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 
275 280 285 

gag aag cat aac ctt cat cat get get cca aat gaa tgc gat cag act 
Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 
290 295 300 

tac caa cca att gat gaa gat att gat act etc ccc etc att gec tgg 
Tyr Gin Pro He Asp Glu Asp He Asp Thr Leu Pro Leu He Ala Trp 
305 310 315 320 

age aag gac ata ctg gec aca gtt gag aat aag aca ttc ttg cga ate 
Ser Lys Asp He Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 
325 330 335 

etc caa tac cag cat ctg ttc ttc atg ggt ctg tta ttt ttc gee cgt 
Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 350 

ggt agt tgg etc ttt tgg age tgg aga tat acc tct aca gca gtg etc 
Gly Ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu 
355 360 365 

tea cct gtc gac agg ttg ttg gag aag gga act gtt ctg ttt cac tac 
Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370 375 380 

ttt tgg ttc gtc ggg aca gcg tgc tat ctt etc cct ggt tgg aag cca 
Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390 395 ~ 400 

tta gta tgg atg gcg gtg act gag etc atg tec ggc atg ctg ctg ggc 
Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

ttt gta ttt gta ctt age cac aat ggg atg gag gtt tat aat teg tct 
Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 * 425 430 

aaa gaa ttc gtg agt gca cag ate gta tec aca egg gat ate aaa gga 
Lys Glu Phe Val Ser Ala Gin He Val Ser Thr Arg Asp He Lys Gly 
435 440 • 445 

aac ata ttc aac gac tgg ttc act ggt ggc ctt aac agg caa ata gag 
Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 
450 455 460 

cat cat ctt ttc cca aca atg ccc agg cat aat tta aac aaa ata gca 
His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 470 475 480 

cct aga gtg gag gtg ttc tgt aag aaa cac ggt ctg gtg tac gaa gac 
Pro Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 



gta tct att get acc ggc act tgc aag gtt ttg aaa gca ttg aag gaa 
Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
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500 . 505 510 

l£? !?! !? C g f g gca gag cag cat * ct acc acc agt taa 
Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 

° 515 520 525 

. <210> 10 

<211> 525 

10 <212> PRT 

<213> Physcomitrella patens 

<400> 10 

15 Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
1 5 10 15 

He Asp val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 
20 25 30 




Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser lie Gin 

25 



35 40 45 



30 



Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
30 55 60 

Val Gin Cys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
65 70 75 so 



35 Thr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg 

85 90 95 

Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
W 100 105 110 




His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn Lys Val Tyr 

5 



115 120 125 



50 



Asp Val Ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val He Ser 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 
5 150 155 160 



55 Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 

165 170 175 

60 Val G1U f5° ^ Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 

° U 180 185 190 



1578 



BASF Plant Science GmbH 



20030015 



PF 54305 DE 



15 

Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
195 200 ^ 205 

Val Met Lys Leu Leu Thr Asn' Val Ala lie Phe Ala Ala Ser lie Ala 
210 215 . 220 

lie He Cys Trp Ser Lys Thr lie Ser Ala Val Leu Ala Ser Ala Cys 
225 230 235 240 

Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
260 265 270 

Tyr Val He Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 
275 280 . 285 

Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 
290 295 300 



Tyr Gin Pro He Asp Glu Asp lie Asp Thr Leu Pro Leu He Ala Trp 
305 310 315 320 



Ser Lys Asp He Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 
325 330 335 

Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 . 345 350 

Gly Ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu 
355 360 365 



Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370 375 380 

Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390 395 "* 400 

Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 



Lys Glu Phe Val Ser Ala Gin He Val Ser Thr Arg Asp He Lys Gly 
435 440 • 445 
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10 



Asn.Ile Phe Asn Asp Trp Phe Thr Gly Gly Leu. Asn Arg Gin lie Glu 
450 455 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys lie Ala 
465 4 ™ 475 480 

Pro Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
4 *5 490 495 



15 val Ser lie Ala -Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 . 505 510 



Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
20 515 520 



525 




<210> 11 

<211> 1192 

25 <212> DNA 

<213> Physcomitrella patens 



<220> 

<221> CDS 

30 <222> (58).. (930) 

<223> Delta-6-Elongase 



35 



40 



• 



50 



55 



60 



<400> 11 

ctgcttcgtc tcatcttggg ggtgtgattc gggagtgggt tgagttggtg gagcgca 57 

atg gag gtc gtg gag aga ttc tac ggt gag ttg gat ggg aag gtc teg 105 
Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
1 5 10 15 

cag ggc gtg aat gca ttg ctg ggt agt ttt ggg gtg gag ttg acg gat 153 
Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 25 ■ 30 

acg ccc act acc aaa ggc ttg ccc etc gtt gac agt ccc aca ccc ate 201 
Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
35 40 45 

gtc etc ggt gtt tct gta tac ttg act att gtc att gga ggg ctt ttg 2*9 
Val Leu Gly Val Ser Val Tyr Leu Thr lie Val He Gly Gly Leu Leu 
50 55 60 

tgg ata aag gee agg gat ctg aaa ccg cgc gee teg gag cca ttt ttg 297 
Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 
65 70 75 so 

etc caa get ttg gtg ctt gtg cac aac ctg ttc tgt ttt gcg etc agt 345 
Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
85 90 95 

ctg tat atg tgc gtg ggc ate get tat cag get att acc tgg egg tac 393 
Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala He Thr Trp Arg Tyr 
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15 



20 




30 



35 



40 



50 



55 
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100 105 no ' 

tct etc tgg ggc aat gca tac aat cct aaa cat aaa gag atg gcg att 
Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala lie 
115 120 125 

ctg gta tac ttg ttc tac atg tct aag tac gtg gaa ttc atg gat acc 
Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 135 140 

gtt ate atg ata ctg aag cgc age acc agg'caa ata age ttc etc cac 
Val lie Met lie Leu Lys Arg Ser Thr Arg Gin He Ser Phe Leu His 
145 150 155 160 

gtt tat cat cat tct tea att tec etc att tgg tgg get att get cat 
Val Tyr His His Ser Ser He Ser Leu He Trp Trp Ala He Ala His 
165 170 - 175 

cac get cct ggc ggt gaa gca tat tgg tct gcg get ctg aac tea gga 
His Ala Pro. Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 185 190 



gtg cat gtt etc atg tat gcg tat tac ttc ttg get gee tgc ctt cga 
w Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
25 195 200 205 

agt age cca aag tta aaa aat aag tac ctt ttt tgg ggc agg tac ttg 
Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 

aca caa ttc caa atg ttc cag ttt atg ctg aac tta gtg cag get tac 
Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 

tac gac atg aaa acg aat gcg cca tat cca caa tgg ctg ate aag att 
Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lys He 
245 250 255 

ttg ttc tac tac atg ate teg ttg ctg ttt ctt ttc ggc aat ttt tac 
Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
260 265 270 

gta caa aaa tac ate aaa ccc tct gac gga aag caa aag gga get aaa 
Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 

act gag tga gctgtatcaa gecatagaaa ctctattatg ttagaacctg 
Thr Glu 
290 



441 



489 



537 



585 



633 



681 



729 



777 



825 



873 



921 



970 



aagttggtgc tttcttatct ccacttatct tttaagcagc atcagttttg aaatgatgtg 1030 

tgggcgtggt ctgeaagtag tcatcaatat aatcggcctg agcacttcag atggattgtt 1090 

agaacatgag taaaagcggt tattaeggtg tttattttgt accaaatcac cgcacgggtg 1150 

aattgaaata tttcagattt gatcaatttc atctgaaaaa aa 1192 



60 <210> 12 
<211> 290 
<212> PRT 
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<213> Physcomitrella patens 
<400> 12 



5 Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
• 10 15 



10 



Gin Gly Val Asn Ala Leu Leu Gly ser Phe Gly Val Glu Leu Thr Asp 



25 



30 



Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp ser Pro Thr Pro He 



15 40 « 

Val Leu Gly Val Ser Val Tyr Leu Thr He Val He Gly Gly Leu Leu 

20 

Trp He Lys Ala Arg 

" 70 75 80 

25 Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 



55 



60 




Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 



85 



90 



95 



35 



Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala He Thr Trp Arg Tvr 
100 105 no 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 



120 



125 



Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
-- L 135 140 



40 



• 



Leu His 
160 



Val lie Met He Leu Lys Arg Ser Thr Arg Gin lie Ser Phe 
X " 150 155 

5 Val Tyr His His Ser Ser He Ser Leu He Trp Trp Ala He Ala His 

165 170 175 

5Q His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 



185 



Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala 



55 



60 



195 



200 



205 



190 



Cys Leu Arg 



Ser Ser Pro Lys Leu Lys Asn Lys Tyr 



210 



215 



Leu Phe Trp Gly Arg Tyr Leu 
220 



Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 



235 



240 
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Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lys He 
245 250 255 



10 



Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
260 265 270 

Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 



15 Thr Glu 

290 



<210> 13 

20 <211> 1410 

<212> DNA 

<213> Phaeodactylum tricornutum 

<220> 

25 <221> CDS 

<222> (1)..(1410) 

<223> Delta-5-Desaturase 



30 



35 



40 



50 



55 



60 



<400> 13 

atg get ccg gat gcg gat aag ctt cga caa cgc cag acg act gcg gta 48 
Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val 
1 5 io 15 

gcg aag cac aat get get acc ata teg acg cag gaa cgc ctt tgc agt 96 
Ala Lys His Asn Ala Ala Thr He Ser Thr Gin Glu Arg Leu Cys Ser 
20 25 30 

ctg tct teg etc aaa ggc gaa gaa gtc tgc ate gac gga ate ate tat 144 
Leu Ser Ser Leu Lys Gly Glu Glu Val Cys He Asp Gly He He Tyr 
35 40 45 

gac etc caa tea ttc gat cat ccc ggg ggt gaa acg ate aaa atg ttt 192 
Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe 
50 55 60 

ggt ggc aac gat gtc act gta cag tac aag atg att cac ccg tac cat 240 
Gly Gly Asn Asp Val Thr Val Gin Tyr Lys Met He His Pro Tyr His 
65 7 0 75 80 

acc gag aag cat ttg gaa aag atg aag cgt gtc ggc aag gtg acg gat 288 
Thr Glu Lys Hxs Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp 
85 90 95 ^ 

ttc gtc tgc gag tac aag ttc gat acc gaa ttt gaa cgc gaa ate aaa 336 
Phe Val cys Glu Tyr Lys Phe Asp Thr Glu Phe Glu Arg Glu He Lys 
100 105 no 

cga gaa gtc ttc aag att gtg cga cga ggc aag gat ttc ggt act ttg 384 
Arg Glu Val Phe Lys He Val Arg Arg Gly Lys Asp Phe Gly Thr Leu 
115 120 125 



20 




40 



• 



60 
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gga tgg ttc ttc cgt gcg ttt tgc tac att gcc att tto ttc tac ctg 
Gly Trp Phe Phe Arg Ala Phe Cys Tyr lie Ala lie Phe Phe Tyr Leu 
130 135 i4 0 

^f 3 tgg 9tC aC ° aCg 9ga acc tct fc 9£r ct S ct S gcc gtg gcc 

•Gin Tyr Has Trp Val Thr Thr Gly Thr Ser Txp Leu Leu Ala Val Ila 

145 150 155 160 



cac tgg acc cac cac get tac acc aat cac gcc gag atg gat ccc gat 
Has Trp Thr Has Has Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp 
210 215 220 

age ttt ggt gcc gaa cca atg etc eta ttc aac gac tat ccc ttg gat 
Ser Phe Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp 
225 230 235 240 



245 250 



255 



ccc gtc ttg get gga tac tgg ttg tec get gtc ttc aat cca caa att 
Pro val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
d5 260 265 270 

ctt gac etc cag eaa cgc ggc gca ctt tec gtc ggt ate cgt etc gac 
Leu Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 
275 280 285 



320 



325 330 



335 



gcg gaa teg etc gcg ctg gcg gtc ctg ttt teg ttg teg cac aat ttc 
Ala Glu Ser Leu Ala Leu Ala Val Leu Phe Ser Leu Ser His Asn Phe 
°° 340 345 350 

gaa tec gcg gat cgc gat ccg acc gcc cca ctg aaa aag acg gga gaa 
Glu Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu 
355 360 365 



432 



480 



1ft ^ a ?° ° ° aa gCg atg att ggc atg aat 9tc cag cac gat gcc 528 

10 Tyr Gly He Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ila 

165 170 175 

aac cac ggg gcc acc tec aag cgt ccc tgg gtc aac gac atg eta ggc 
Asn Has Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly 
10 iSO 1 85 190 

etc ggt gcg gat ttt att ggt ggt tec aag tgg etc tgg cag gaa caa 
Leu Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin 
195 200 205 



576 



624 



672 



720 



™ ?! ? C ?? fc ° gt a f° t9g ° ta Cat CgC ttfc caa gca ttc fctt tac atg 768 
Has Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met 



816 



864 



aac get ttc att cac teg cga cgc aag tat gcg gtt ttc tgg egg get 912 
Asn Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala ■ 
29° 295 300 

2*? l aC ' g n g 9tg aaC gtg att gct ccg ttfc tac aca aa = tec ggc 960 
Val Tyr He Ala Val Asn Val He Ala Pro Phe Tyr Thr Asn Ser Gly 
305 310 315 



c n ctc gaa tgg tcc tgg cgt gtc ttt gga aac ate atg etc atg ggt gtg 1008 
50 Leu Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val 



1056 



1104 



cca gtc gac tgg ttc aag aca cag gtc gaa act tcc tgc act tac ggt 1152 
Pro Val Asp Trp Phe Lys Thr Gin Val Glu Thr Ser Cys Thr Tyr Gly 



BASF Plant Science GmbH 



20030015 



PF 54305 DE 



21 

370 375 380 

?? a ^ C f tfc t CC ggt tgc ttc acg gga ggt ctc aac ttfc ca ^ Ott gaa 1200 
Gly Phe Leu Ser Gly Cys Phe Thr Gly Gly Leu Asn Phe Gin Val Ilu 

385 390 395 400 

cac cac ttg ttc cca cgc atg age age get tgg tat ccc. tac att gee 1248 
His His Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr He Ala 
405 410 ~ 415 



ccc aag gtc cgc gaa att tgc gec aaa cac ggc gtc cac tac gee tac 
Pro Lys Val Arg Glu He Cys Ala Lys His Gly Val His Tyr Ala Tyr 



420 425 



430 



gcg gec ggg acc ggt gec aac tgg cgc cag atg gee aga gaa aat ccc 
Ala Ala Gly Thr Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro 
450 455 4 60 



1296 



^ " g *? C ^ C C f a aac tfct ctc tcc acc Ote cgc tac atg cac 1344 

Tyr Pro Trp He His Gin Asn Phe Leu Ser Thr Val Arg Tyr Met His 
435 440 445 



1392 



ttg acc gga egg gcg taa 

Leu Thr Gly Arg Ala 410 
465 



<210> 14 

<211> 469 

<212> PRT 

<213> Phaeodactylum tricornutum 

<400> 14 

Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val 
1 5 10 15 

Ala Lys His Asn Ala Ala Thr He Ser Thr Gin Glu Arg Leu Cys Ser 
20 25 30 

Leu Ser Ser Leu Lys Gly Glu Glu Val Cys He Asp Gly He He Tyr 
3 5 40 45 

Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe 
50 55 6 o 

Gly Gly Asn Asp Val Thr Val Gin Tyr Lys Met He His Pro Tyr His 
65 70 75 so 

Thr Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp 
85 go 95 

Phe Val cys Glu Tyr Lys Phe Asp Thr Glu Phe Glu Arg Glu He Lys 
100 105 no 
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Arg Glu Val Phe Lys lie Val Arg Arg Gly Lys Asp Phe Gly Thr Leu 
H5 120 125 

Gly Trp Phe Phe Arg Ala Phe Cys Tyr- lie Ala He Phe Phe Tyr Leu 
130 135 " 140 

Gin Tyr His Trp Val Thr Thr Gly Thr Ser Trp Leu Leu Ala Val Ala 
I 45 150 • 155 160 

Tyr Gly He Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ala 
165 170 175 

Asn His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly 
180 185 190 

Leu Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin 
195 200 205 

His Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp 
210 215 220 

Ser Phe Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp 
225 230 235 240 

His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met 
245 ' 250 255 

Pro Val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
260 265 270 

Leu Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 
275 280 285 

Asn Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala 
290 295 300 

Val Tyr He Ala Val Asn Val He Ala Pro Phe Tyr Thr Asn Ser Gly 
305 310 315 320 

Leu Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val 
325 330 335 

Ala Glu Ser Leu Ala Leu Ala Val Leu Phe Ser Leu Ser His Asn Phe 
340 345 350 



Glu Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu 
355 360 365 
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Pro Val Asp Trp Phe Lys ^ Gln val Qlu %r ^ ^ ^ 

5 . 375 380 

Gly Phe Leu Ser Gly cys Phe Thr Gly Gly Leu Asn Phe Gin Val Glu 

395 400 

His His L eu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro ^ Ile Ala 

410 415 



10 



15 Pro Lys val Arg G lu Xle Cys Ala Lys His Gly Val His Tyr Ua ^ 

425 430 

20 S H±S IS L6U SSr Val *rg Tyr Met His 




44 ° 445 



Ala Ala Gly Thr Gly Ala Asn Trp Arg Gln Met Ala Arg Glu Asn Pro 



25 " 460 



30 



35 



40 



Leu Thr Gly Arg Ala 
465 



<210> IS • 

<211> 3598 

<212> DNA 

<213> artificial sequence 



<220> 

<221> misc_feature 



<400> 15 



50 



tcgcgcgttt cggtgatgao ggtgaaaacc tctgacacat gcagctcccg gagacggtca 
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 
55 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cggcgcgccg agctcctcga 
gcaaatttac acattgccac taaacgtcta aacccttgta atttgttttt gttttactat 
6Q gtgtgttatg tatttgattt gcgataaatt tttatatttg gtactaaatt tataacacct 
tttatgctaa cgtttgccaa cacttagcaa tttgcaagtt gattaattga ttctaaatta 



60 
120 
180 
240 
300 
360 
42 0 
480 
540 
600 



10 



15 



20 
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tttttgtctt ctaaatacat atactaatca actggaaatg taaatatttg ctaatatttc 660 

tactatagga gaattaaagt gagtgaatat ggtaccacaa ggtttggaga tttaattgtt 720 

gcaatgctgc atggatggca tatacaccaa acattcaata attcttgagg ataataatgg 780 

taccacacaa gatttgaggt gcatgaacgt cacgtggaca aaaggtttag taatttttca 840 

agacaacaat gttaccacac acaagttttg aggtgcatgc atggatgccc tgtggaaagt 900 

ttaaaaatat tttggaaatg atttgcatgg aagccatgtg taaaaccatg acatccactt 960 

ggaggatgca ataatgaaga aaactacaaa tttacatgca actagttatg catgtagtct 1020 

atataatgag gattttgcaa tactttcatt catacacact cactaagttt tacacgatta 1080 

taatttcttc atagccagcc caccgcggtg ggcggccgcc tgcagtctag aaggcctcct 1140 

gctttaatga gatatgcgag acgcctatga tcgcatgata tttgctttca attctgttgt 1200 

gcacgttgta aaaaacctga gcatgtgtag ctcagatcct taccgccggt ttcggttcat 1260 

tctaatgaat atatcacccg ttactatcgt atttttatga ataatattct ccgttcaatt 132 0 

25 tactgattgt ccgtcgacga attcgagctc ggcgcgccaa gcttggcgta atcatggtca 1380 

tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 1440 

agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 1500 

cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 1560 

caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 162 0 

tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 1680 

cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 1740 

aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 1800 

gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 1860 

agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 192 0 

cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 1980 

cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 204 0 

ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 2100 

gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 2160 

tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 2220 

55 acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 2280 

tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 2340 

attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 2400 

gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 2460 



30 



35 



40 



50 



60 



BASF Plant Science GmbH 



20030015 



PF 54305 DE 



10 



0 



5 



ttcacctaga 
taaacttggt 
5 ctatttcgtt 
ggcttaccat 
gatttatcag 
ttatccgcct 
gttaatagtt 
5 tttggtatgg 
. atgttgtgca 
gccgcagtgt 
tccgtaagat 
atgcggcgac 
agaactttaa 
ttaccgctgt 
tcttttactt 
aagggaataa 
tgaagcattt 
aataaacaaa 
accattatta 



tccttttaaa 
ctgacagtta 
catccatagt 
ctggccccag 
caataaacca 
ccatccagtc 
tgcgcaacgt 
cttcattcag 
aaaaagcggt 
tatcactcat 
gcttttctgt 
cgagttgctc 
aagtgctcat 
tgagatccag 
tcaccagcgt 
gggcgacacg 
atcagggtta 
taggggttcc 
tcatgacatt 



ttaaaaatga 
ccaatgctta 
tgcctgactc 
tgctgcaatg- 
gccagccgga 
tattaattgt 
tgttgccatt 
ctccggttcc 
tagctccttc 
ggttatggca 
gactggtgag 
ttgcccggcg 
cattggaaaa 
ttcgatgtaa 
ttctgggtga 
gaaatgttga 
ttgtctcatg 
gcgcacattt 
aacctataaa 



25 

agttttaaat 
atcagtgagg 
cccgtcgtgt 
• ataccgcgag 
sgggccgagc 
tgccgggaag 
gctacaggca 
caacgatcaa 
ggtcctccga 
gcactgcata 
tactcaacca 
tcaatacggg 
cgttcttcgg 
cccactcgtg 
gcaaaaacag 
atactcatac 
agcggataca 
ccccgaaaag 
aataggcgta 



caatctaaag 
cacctatctc 
agataactac 
acccacgctc 
gcagaagtgg 
ctagagtaag 
tcgtggtgtc 
ggcgagttac 
tcgttgtcag 
attctcttac 
agtcattctg 
ataataccgc 
ggcgaaaact 
cacccaactg 
gaaggcaaaa 
tcttcctttt 
tatttgaatg 
tgccacctga 
tcacgaggcc 



tatatatgag 
agcgatctgt 
gatacgggag 
accggctcca 
tcctgcaact 
tagttcgcca 
acgctcgtcg 
atgatccccc 
aagtaagttg 
tgtcatgcca 
agaatagtgt 
gccacatagc' 
ctcaaggatc 
atcttcagca 
tgccgcaaaa 
tcaatattat 
tatttagaaa 
cgtctaagaa 
ctttcgtc 



2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3598 



<210> 16 

<211> 3590 

<212> DNA 

<213> artificial sequence 
<220> 

<221> misc_feature 

< 223 > ^^^-^^eine^fWliche Prcotor-^inator-^essio^ 



<400> 16 
tcgcgcgttt 

cagcttgtct 

ttggcgggtg 

accatatgcg 

attcgccatt 

tacgccagct 



cggtgatgac 
gtaagcggat 
tcggggctgg 
gtgtgaaata 
caggctgcgc 
ggcgaaaggg 



gsrtgaaaacc 
gccgggagca 
cttaactatg 
ccgcacagat 
aactgttggg 
ggatgtgctg 



tctgacacat 
gacaagcccg 
cggcatcaga 
gcgtaaggag 
aagggcgatc 
caaggcgatt 



gcagctcccg 
tcagggcgcg 
gcagattgta 
aaaataccgc 
ggtgcgggcc 
aagttgggta 



gagacggtca 
tcagcgggtg 
ctgagagtgc 
atcaggcgcc 
tcttcgctat 
acgccagggt 



60 
120 
180 
240 
300 
360 



BASF Plant Science GmbH 



20030015 



PF 54305 DE 



26 




10 



15 



20 



25 



30 



35 



40 



50 



55 



60 



tttcccagtc 


acgacgttgt 


aaaacgacgg 


ccagtgaatt 


cggcgcgccg 


agctcctcga 


42 0 


gcaaatttac 


acattgccac 


taaacgtcta 


aacccttgta 


atttgttttt 


gttttactat 


480 


gtgtgttatg 


tatttgattt 


gcgataaatt 


tttatatttg 


gtactaaatt 


tataacacct 


'540 


tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga 


ttctaaatta 


600 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg 


ctaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgaatat 


ggtaccacaa 


ggtttggaga 


tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg 


ataataatgg 


780 


taccacacaa 


gatttgaggt 


gcatgaacgt 


cacgtggaca 


aaaggtttag 


taatttttca 


840 


agacaacaat 


gttaccacac 


acaagttttg 


aggtgcatgc 


atggatgccc 


tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg 


acatccactt 


960 


ggaggatgca 


ataatgaaga 


aaactacaaa 


tttacatgea 


actagttatg 


catgtagtct 


1020 


atataatgag 


gattttgcaa 


tactttcatt 


catacacact 


cactaagttt 


tacacgatta 


1080 


taatttcttc 


atagccagcg 


gatccgatat 


cgggcccgct 


agegttaace 


ctgctttaat 


1140 


gagatatgcg 


agacgcctat 


gatcgcatga 


tatttgettt 


caattctgtt 


gtgcacgttg 


1200 


taaaaaacct 


gagcatgtgt 


age tc agate 


cttaccgccg 


gtttcggttc 


attctaatga 


1260 


atatatcacc 


cgttactatc 


gtatttttat 


gaataatatt 


ctccgttcaa 


tttactgatt 


1320 


gtccgtcgac 


gaattcgagc 


tcggcgcgcc 


aagcttggcg 


taatcatggt 


catagctgtt 


1380 


tcctgtgtga 


aattgttatc 


cgctcacaat 


tccacacaac 


atacgagecg 


gaagcataaa 


1440 


gtgtaaagcc 


tggggtgcct 


aatgagtgag 


ctaactcaca 


ttaattgcgt 


tgcgctcact 


1500 


gcccgctttc 


cagtcgggaa 


acctgtcgtg 


ccagctgcat 


taatgaatcg 


gccaacgcgc 


1560 


ggggagaggc 


ggtttgcgta 


ttgggcgctc 


ttccgcttcc 


tcgctcactg 


actcgctgcg 


1620 


ctcggtcgtt 


cggctgcggc 


gageggtate 


agctcactca 


aaggcggtaa 


tacggttatc 


1680 


cacagaatca 


ggggataacg 


caggaaagaa 


catgtgagca 


aaaggecage 


aaaaggccag 


1740 


gaaccgtaaa 


aaggccgcgt 


tgctggcgtt 


tttccatagg 


ctccgccccc 


ctgacgagca 


1800 


tcacaaaaat 


cgacgctcaa 


gtcagaggtg 


gcgaaacccg 


acaggactat 


aaagatacca 


1860 


ggcgtttccc 


cctggaagct 


ccctcgtgcg 


ctctcctgtt 


ccgaccctgc 


cgcttaccgg 


1920 


atacctgtcc 


gcctttctcc 


c 1 1 c cr croraa cr 


^y uy y *-y i. u. 


uw. ted toy cc 


caegctgtag 


i o o n 

1980 


gtatctcagt 


tcggtgtagg 


tcgttcgctc 


caagctgggc 


tgtgtgcacg 


aaccccccgt 


2040 


tcagcccgac 


cgctgcgcct 


tatceggtaa 


etategtett 


gagtccaacc 


eggtaagaca 


2100 


cgacttatcg 


ccactggcag 


cagccactgg 


taacaggatt 


ageagagega 


ggtatgtagg 


2160 


cggtgctaca 


gagttcttga 


agtggtggcc 


taactaegge 


tacactagaa 


ggacagtatt 


2220 
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tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 2280 

cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg ' 2340 

cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 2400 

gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 2460 

gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 2520 

gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 2580 

ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 2640 

atctggcccc agtgctgcaa tgataccgcg agacccacgc toaccggctc cagatttatc 2700 

agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 2760 

ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 282 0 

tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 2880 

ggcttcattc agctccggtt cocaacgatc aaggcgagtt acatgatccc ccatgttgtg 2940 

caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 3000 

gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 3060 

atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 312 0 

accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt 3180 

aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 3240 

gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 3300 

tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 3360 

aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 34 20 

ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 3480 

aataggggtt ccgcgcacat ttccccgaaa agtgccacct gaogtctaag aaaccattat 3540 

tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 359 0 

<210> 17 
<211> 3584 
<212> DNA 

<213> artificial sequence 
<220> 

<221> misc_feature 

<223> SSSTJ^^S^^' — — - 

<400> 17 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 



10 



15 



20 
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cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 12 0 

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cggcgcgccg agctcctcga ~420 

gcaaatttac acattgccac taaacgtcta aacccttgta atttgttttt gttttactat 480 

gtgtgttatg tatttgattt gcgataaatt tttatatttg gtactaaatt tataacacct 540 

tttatgctaa cgtttgccaa cacttagcaa tttgcaagtt gattaattga ttctaaatta 600 

tttttgtctt ctaaatacat atactaatca actggaaatg taaatatttg ctaatatttc 660 

tactatagga gaattaaagt gagtgaatat ggtaccacaa ggtttggaga tttaattgtt 720 

gcaatgctgc atggatggca tatacaccaa acattcaata attcttgagg ataataatgg 780 

25 taccacacaa gatttgaggt gcatgaacgt cacgtggaca aaaggtttag taatttttca 840 

agacaacaat gttaccacac acaagttttg aggtgcatgc atggatgccc tgtggaaagt 900 

ttaaaaatat tttggaaatg atttgcatgg aagccatgtg taaaaccatg acatccactt 960 

ggaggatgca ataatgaaga aaactacaaa tttacatgca actagttatg catgtagtct 1020 

atataatgag gattttgcaa tactttcatt catacacact cactaagttt tacacgatta 1080 

35 taatttcttc atagccagca gatctgccgg catcgatccc gggccatggc ctgctttaat 1140 

gagatatgcg agacgcctat gatcgcatga tatttgcttt caattctgtt gtgcacgttg 1200 

taaaaaacct gagcatgtgt agctcagatc cttaccgccg gtttcggttc attctaatga 12 60 

atatatcacc cgttactatc gtatttttat gaataatatt ctccgttcaa tttactgatt 1320 

gtccgtcgac gagctcggcg cgccaagctt ggcgtaatca tggtcatagc tgtttcctgt 1380 

gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 1440 

agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 1500 

tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 1560 

aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 1620 

cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 1680 

55 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 1740 

taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 1800 

aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 1860 

tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 192 0 



30 



40 



50 
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gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 1980 

cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 2040 

cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 2100 

atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 2160 

tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 222 0 

ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 2280 

acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa " 2340 

15 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 2400 

aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 2460 

tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 2520 

cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 2580 

catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 2640 

25 ccccagtgct gcaatgatae cgcgagaccc acgctcaccg gctccagatt tatcagcaat 2700 

aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 2760 

ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 282 0 

caacgttgtt gccattgcta caggcatcgt- ggtgtcacgc tcgtcgtttg gtatggcttc 2880 

attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 294 0 

35 agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 3000 

actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt . 3060 

ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 312 0 

ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 3180 

gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 324 0 

atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 3300 

cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 3360 

gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 3420 

gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 3480 

ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat 3540 

55 gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtc 3584 

<210> 18 
<211> 4507 
60 <212> DNA 

<213> artificial sequence 



30 



40 



50 
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<220> 

<221> misc_feature 



<400> 18 
tcgcgcgttt 




10 



15 



20 



25 



30 



35 



40 



5 



0 



cagcttgtct 
ttggcgggtg 
accatatgcg 
attcgccatt 
tacgccagct 
tttcccagtc 
gcaaatttac 
gtgtgttatg 
tttatgctaa 
tttttgtctt 
tactatagga 
gcaatgctgc 
taccacacaa 
agacaacaat 
ttaaaaatat 
ggaggatgca 
atataatgag 
taatttcttc 
gctttaatga 
gcacgttgta 
tctaatgaat 
tactgattgt 
tgtttttgtt 
ctaaatttat 
taattgattc 
atatttgcta 
ttggagattt 



cggtgatgac 
gtaagcggat 
tcggggctgg 
gtgtgaaata 
caggctgcgc 
ggcgaaaggg 
acgacgttgt 
acattgccac 
tatttgattt 
cgtttgccaa 
ctaaatacat 
gaattaaagt 
atggatggca 
gatttgaggt 
gttaccacac 
tttggaaatg 
ataatgaaga 
gattttgcaa 
atagccagcc 
gatatgcgag 
aaaaacctga 
atatcacccg 
ccgtcgagca 
ttactatgtg 
aacacctttt 
taaattattt 
atatttctac 
aattgttgca 



srgtgaaaacc 
gccgggagca 
cttaactatg 
ccgcacagat 
aactgttggg 
ggatgtgctg 
aaaacgacgg 
taaacgtcta 
gcgataaatt 
cacttagcaa 
atactaatca 
gagtgaatat 
tatacaccaa 
gcatgaacgt 
acaagttttg 
atttgcatgg 
aaactacaaa 
tactttcatt 
caccgcggtg 
acgcctatga 
gcatgtgtag 
ttactatcgt 
aatttacaca 
tgttatgtat 
atgctaacgt 
ttgtcttcta 
tataggagaa 
atgctgcatg 



tctgacacat 
gacaagcccg 
cggcatcaga 
gcgtaaggag 
aagggcgatc 
caaggcgatt 
ccagtgaatt 
aacccttgta 
tttatatttg 
tttgcaagtt 
actggaaatg 
ggtaccacaa 
acattcaata 
cacgtggaca 
aggtgcatgc 
aagccatgtg 
tttacatgca 
catacacact 
ggcggccgcc 
tcgcatgata 
ctcagatcct 
atttttatga 
ttgccactaa 
ttgatttgcg 
ttgccaacac 
aatacatata 
ttaaagtgag 
gatggcatat 



gcagctcccg 
tcagggcgcg 
gcagattgta 
aaaataccgc 
9*9Ttgcgggcc 
aagttgggta 
cggcgcgccg 
atttgttttt 
gtactaaatt 
gattaattga 
taaatatttg 
ggtttggaga 
attcttgagg 
aaaggtttag 
atggatgccc 
taaaaccatg 
actagttatg 
cactaagttt 
tgcagtctag 
tttgctttca 
taccgccggt 
ataatattct 
acgtctaaac 
ataaattttt 
ttagcaattt 
ctaatcaact 
tgaatatggt 
acaccaaaca 



gagacggtca 
tcagcgggtg 
ctgagagtgc 
atcaggcgcc 
tcttcgctat 
acgccagggt 
agctcctcga 
gttttactat 
tataacacct 
ttctaaatta 
ctaatatttc 
tttaattgtt 
ataataatgg 
taatttttca 
tgtggaaagt 
acatccactt 
catgtagtct 
tacacgatta 
aaggcctcct 
attctgttgt 
ttcggttcat 
ccgttcaatt 
ccttgtaatt 
atatttggta 
gcaagttgat 
ggaaatgtaa 
accacaaggt 
ttcaataatt 



60 
120 
18a 
240 
300 
360 
420 
480 
540 
600 
660 
72 0 
780 
84 0* 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
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cttgaggata 
ggtttagtaa 
gatgccctgt 
aaccatgaca 
. agttatgcat 
taagttttac 
gttaaccctg 
ttctgttgtg 
tcggttcatt 
cgttcaattt 
tcatggtcat 
cgagccggaa 
attgcgttgc 
tgaatcggcc 
ctcactgact 
gcggtaatac 
ggccagcaaa 
cgcccccctg 
ggactataaa 
accctgccgc 
catagctcac 
gtgcacgaac 
tccaacccgg 
agagcgaggt 
actagaagga 
gttggtagct 
aagcagcaga 
gggtctgacg 
aaaaggatct 
atatatgagt 
gcgatctgtc 



ataatggtac 
tttttcaaga 
ggaaagttta 
tccacttgga 
gtagtctata 
acgattataa 
ctttaatgag 
cacgttgtaa 
ctaatgaata 
actgattgtc 
agctgtttcc 
gcataaagtg 
gctcactgcc 
aacgcgcggg 
cgctgcgctc 
ggttatccac 
aggccaggaa 
acgagcatca 
gataccaggc 
ttaccggata 
gctgtaggta 
cccccgttca 
taagacacga 
atgtaggcgg 
cagtatttgg 
cttgatccgg 
ttacgcgcag 
ctcagtggaa 
tcacctagat 
aaacttggtc 
tatttcgttc 



cacacaagat 
caacaatgtt 
aaaatatttt 
ggatgcaata 
taatgaggat 
tttcttcata 
atatgcgaga 
aaaacctgag 
tatcacccgt 
cgtcgacgaa 
tgtgtgaaat 
taaagcctgg 
cgctttccag 
gagaggcggt 
ggtcgttcgg 
agaatcaggg 
ccgtaaaaag 
caaaaatcga 
gtttccccct 
cctgtccgcc 
tctcagttcg 
gcccgaccgc 
cttatcgcca 
tgctacagag 
tatctgcgct 
caaacaaacc 
aaaaaaagga 
cgaaaactca 
ccttttaaat 
tgacagttac 
atccatagtt 



31 

ttgaggtgca 
accacacaca 
ggaaatgatt 
atgaagaaaa 
tttgcaatac 
gccagcggat 
cgcctatgat 
catgtgtagc 
tactatcgta 
ttcgagctcg 
tgttatccgc 
ggtgcctaat 
tcgggaaacc 
ttgcgtattg 
ctgcggcgag 
gataacgcag 
gccgcgttgc 
cgctcaagtc 
ggaagctccc 
tttctccctt 
gtgtaggtcg 
tgcgccttat 
ctggcagcag 
ttcttgaagt 
ctgctgaagc 
accgctggta 
tctcaagaag 
cgttaaggga 
taaaaatgaa 
caatgcttaa 
gcctgactcc 



tgaacgtcac 
agttttgagg 
tgcatggaag 
ctacaaattt 
tttcattcat 
ccgatatcgg 
cgcatgatat 
tcagatcctt 
tttttatgaa 
gcgcgccaag 
tcacaattcc 
gagtgagcta 
tgtcgtgcca 
ggcgctcttc 
cggtatcagc 
gaaagaacat 
tggcgttttt 
agaggtggcg 
tcgtgcgctc 
cgggaagcgt 
ttcgctccaa 
ccggtaacta 
ccactggtaa 
ggtggcctaa 
cagttacctt 
gcggtggttt 
atcctttgat 
ttttggtcat 
gttttaaatc 
tcagtgaggc 
ccgtcgtgta 



gtggacaaaa 
tgcatgcatg 
ccatgtgtaa 
acatgcaact 
acacactcac 
gcccgctagc 
ttgctttcaa 
accgccggtt 
taatattctc 
cttggcgtaa 
acacaacata 
actcacatta 
gctgcattaa 
cgcttcctcg 
tcactcaaag 
gtgagcaaaa 
ccataggctc 
aaacccgaca 
tcctgttccg 
ggcgctttct 
gctgggctgt 
tcgtcttgag 
caggattagc 
ctacggctac 
cggaaaaaga 
ttttgtttgc 
cttttctacg 
gagattatca 
aatctaaagt 
acctatctca 
gataactacg 



1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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10 



15 



20 



25 



30 



35 



40 



50 



55 



atacgggagg 
ccggctccag 
cctgcaactt 
agttcgccag 
cgctcgtcgt 
tgatccccca 
agtaagttgg 
gtcatgccat 
gaatagtgta 
ccacatagca 
tcaaggatct 
tcttcagcat 
gccgcaaaaa 
caatattatt 
atttagaaaa 
gtctaagaaa 
tttcgtc 



gcttaccatc 
atttatcagc 
tatccgcctc 
ttaatagttt 
ttggtatggc 
tgttgtgcaa 
ccgcagtgtt 
ccgtaagatg 
tgcggcgacc 
gaactttaaa 
taccgctgtt 
cttttacttt 
agggaataag 
gaagcattta 
ataaacaaat 
ccattattat 



tggccccagt 
aataaaccag 
catccagtct 
gcgcaacgtt 
ttcattcagc 
aaaagcggtt 
atcactcatg 
cttttctgtg 
gagttgctct 
agtgctcatc 
gagatccagt 
caccagcgtt 
ggcgacacgg 
tcagggttat 
aggggttccg 
catgacatta 



gctgcaatga 
ccagccggaa 
attaattgtt 
gttgccattg 
.tccggttccc 
agctccttcg 
gttatggcag 
actggtgagt 
tgcccggcgt 
attggaaaac 
tcgatgtaac 
tctgggtgag 
aaatgttgaa 
tgtctcatga 
cgcacatttc 
acctataaaa 



taccgcgaga 
gggccgagcg 
gccgggaagc 
ctacaggcat 
aacgatcaag 
gtcctccgat 
cactgcataa 
actcaaccaa 
caatacggga 
gttcttcggg 
ccactcgtgc 
caaaaacagg 
tactcatact 
gcggatacat 
cccgaaaagt 
ataggcgtat 



cccacgctca 
cagaagtggt 
tagagtaagt 
cgtggtgtca 
gcgagttaca 
cgttgtcaga 
ttctcttact 
gtcattctga 
taataccgcg 
gcgaaaactc 
acccaactga 
aaggcaaaat 
cttccttttt 
atttgaatgt 
gccacctgac 
cacgaggccc 



<210> 19 
<211> 17752 

<212> DNA 

<213> Phaeodactylum tricornutum, Physcomitrella patens 

<220> 

<221> CDS 

<222> (11543) . . (12415) 

<223> Delta-6-Elongase 

<220> 

<221> CDS 

<222> (13313) . . (14890) 

<2 2 3 > Del t a- 6 -Desa turase 

<220> 

<221> CDS 

<222> (15791) . . (17200) 

<223> Delta-5-Desaturase 



3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4507 



60 <400> 19 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 
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gcgcccagca 
tagtgggcgg 
ataatcaggc 
atgttgggtt 
ttctttatca 
tgacaaagtt 
gcgtagacgg 
tttactggca 
cggagaatca 
ggaatgcccg 
ccggcacgcg 
gcgaggcggg 
ctgttggggc 
ccgttgaaca 
ccggtccgga 
ggaggctcgt 
tgccggagcg 
ccaccgcgtc 
ccaagcctca 
gctcactgac 
ggcggtaata 
aggccagcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
ccgctgcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
ctaccgccgg 
agggcagccc 



caggtgcgca 
tgacgtcgtt 
cgatgccgac 
tcacgtctgg 
ctgataagtt 
gcagccgaat 
tctgacgaca 
cttcaggaac 
tacgcattcg 
cagcttcagg 
accgggcgca 
tttttcggcc 
cgtgcttgag 
ggctccgctc 
cgcagcgttc 
tgtcaggaac 
caacccactc 
agacgcccgt 
cggccgcgct 
tcgctgcgct 
cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 
acctatcaag 



ggcaaattgc 
cgagtgaacc 
agcgtcgagc 
cctccggacc 
ggtggacata 
acagtgatcc 
cgcaaactgg 
aagcgggcgc 
gtgccgagag 
caggcgctgc 
ccgcagatgg 
ergggacgccg 
gagcaggccg 
tcgccgctgt 
gagcagggac 
gttgaaggac 
actacagcag 
agcagcccgc 
cggcctctct 
cggtcgttcg 
cagaatcagg 
accgtaaaaa 
acaaaaatcg 
cgtttccccc 
acctgtccgc 

ggggtcatta 

tgccaaaggg 
ggtgaagtag 
gcggtgctca 
gagggcaagc 
gtgtactgcc 



33 

accaacgcat 
agatcgcgca 
gcgacagtgc 
agcctccgct 
ttatgtttat 
gtgccgccct 
cggaacggtt 
tgctcgacgc 
ccgacgacga 
tcgcctaccg 
aaacggccga 
tcaatgcgct 
gcgacagcga 
tgcgggccgc 
tcgcggtgat 
cgagaaaggg 
agccatgtag 
tacgggcttt 
ggcggccttc 
gctgcggcga 
ggataacgca 
ggccgcgttg 
acgctcaagt 
tggaagctcc 
ctttctccct 
tagcgatttt 
ttcgtgtaga 
gcccacccgc 
acgggaatcc 
ggatggctga 
ttccagacga 



acagcgccag 
ggaggcccgg 
tcagaattac 
ggtccgattg 
cagtgataaa 
ggacctgttg 

gggggttcag 
actggccgaa 
ctggcgctca 
cgatggcgcg 
cgcgcagctt 
gatgacaatc 
tgccggcgag 
gatagacgcc 
tgtcgatgga 
tgacgattga 
acaacatccc 
ttcatgccct 
tggcgctctt 
gcggtatcag 
ggaaagaaca 
ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 
acgaagagcg 



cagaatgcca 
cagcaccggc 
gatcaggggt 
aacgcgcgga 
gtgtcaagca 
aacgaggtcg 
cagccggcgc 
gccatgctgg 
tttctgatcg 
cgcatccatg 
cgcttcctct 
agctacttca 
cgcggcggca 
ttcgacgaag 
ttggcgaaaa 
tcaggaccgc 
ctcccccttt 
gccctagcgt 
ccgcttcctc 
ctcactcaaa 
tgtgagcaaa 
tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttt 
ccatcctttt 
tgtatccaac 
tccttcttca 
ggctggccgg 
ccaaccagga 
attgaggaaa 



12 0 
180 
240 
300 
360 
42 0 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 
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aggcggcggc ggccggcatg agcctgtcgg 
aaatcacggg cgtcgtggac tatgagcacg 
5 tgggccgcct gggcggcctg ctgaaactct 
tcggtgatgc cacgatcctc gccctgctgg 
gcaaggtcat gatgggcgtg gtccgcccga 

10 

aacggccggg gggtgcgcgt gattgccaag 
gacttcgcgg agctggtgaa gtacatcacc 
15 gacgctcacc gggctggttg ccctcgccgc 
cgcgccagaa acgccgtcga agccgtgtgc 
cctcgcggaa aacttggccc tcactgacag 

20 

cgactcaccc ggcgcggcgt tgacagatga 
^j^^ gagctggcca gcctcgcaaa tcggcgaaaa 
25 gatgtggaca agcctgggga taagtgccct 
tgacagatga ggggcgcgat ccttgacact 
gcacctattg acatttgagg ggctgtccac 

30 

ccgcccgttt ttcggccacc gctaacctgt 
aaaccttgtt tttaaccagg gctgcgccct 
35 tgccccccct tctcgaaccc tcccggcccg 
tgcgcccctc ggccgcgaac ggcctcaccc 
ttgccgggat cggggcagta acgggatggg 

40 

ttgacgtgcc gcaggtgctg gcatcgacat 

•gcggcctggg tggcggcctg cccttcactt 
5 cggggccggc aatttttacc ttgggcattc 
tgttcggggg tgcgataaac ccagcgaacc 
gtatgaaaac gagaattgga cctttacaga 

50 

ctaccaagac gaagaggatg aagaggatga 
tactgataag ataatatatc ttttatatag 
55 ggcaaggcat aggcagcgcg cttatcaata 
tgcatggact aatgcttgaa acccaggaca 
attgggtaat gactccaact tattgatagt 

60 

tgtcatgcag ctccaccgat tttgagaacg 
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34 








cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


•3180 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


3780 
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gctgcctcag attcaggtta 
gcagctttcc cttcaggcgg 
cgtcaaaggg tgacagcagg 
atacgtgcgc aacaaccgtc 
gcgatttagc cccgacatag 
tgcccggctg tatgcgcgag 
cgtgttgagg ccaacgccca 
catatcaatg attttctggt 
ccatgtttta cggcagtgag 
acgcaccacc ccgtcagtag 
agcacctcaa aaacaccatc 
tggtttcaaa atcggctccg 
aaaagctgtt ttctggtatt 
cttgttataa ttagcttctt 
taaatggcta aaatgagaat 
gtaaaagata cggaaggaat 
aacctatatt taaaaatgac 
gaaaaggaca tgatgctatg 
gaacggcatg atggctggag 
gaagagtatg aagatgaaca 
aggctctttc actccatcga 
ttagccgaat tggattactt 
gaagaagaca ctccatttaa 
cccgaagagg aacttgtctt 
gatggcaaag taagtggctt 
gacattgcct tctgcgtccg 
ctattttttg acttactggg 
ctggatgaat tgttttagta 
caccgacttc ttccgcatca 
gggcaagggg tcgctggtat 
cggccagacg gtctacggga 



tgccgctcaa ttcgctgcgt atatcgcttg 
gattcataca gcggccagcc atccgtcatc 
ctcataagac gccccagcgt cgccatagtg 
ttccggagac tgtcatacgc gtaaaacagc 
ccccactgtt cgtccatttc cgcgcagacg 
gttaccgact gcggcctgag ttttttaagt 
taatgcgggc tgttgcccgg catccaacgc 
gcgtaccggg ttgagaagcg gtgtaagtga 
agcagagata gcgctgatgt ccfggcggtgc 
ctgaacagga gggacagctg atagacacag 
atacactaaa tcagtaagtt ggcagcatca 
tcgatactat gttatacgcc aactttgaaa 
taaggtttta gaatgcaagg aacagtgaat 
ggggtatctt taaatactgt agaaaagagg 
atcaccggaa ttgaaaaaac tgatcgaaaa 
gtctcctgct aaggtatata agctggtggg 
ggacagccgg tataaaggga ccacctatga 
gctggaagga aagctgcctg ttccaaaggt 
caatctgctc atgagtgagg ccgatggcgt 
aagccctgaa aagattatcg agctgtatgc 
catatcggat tgtccctata cgaatagctt 
actgaataac gatctggccg atgtggattg 
agatccgcgc gagctgtatg attttttaaa 
ttcccacggc gacctgggag acagcaacat 
tattgatctt gggagaagcg gcagggcgga 
gtcgatcagg gaggatatcg gggaagaaca 
gatcaagcct gattgggaga aaataaaata 
cctagatgtg gcgcaacgat gccggcgaca 
agtgttttgg ctctcaggcc gaggcccacg 
tcgtgcaggg caagattcgg aataccaagt 
ccgacttcat tgccgataag gtggattatc 



ctgattacgt 
catatcacca 
cgttcaccga 
cagcgctggc 
atgacgtcac 
gacgtaaaat 
cattcatggc 
actgcagttg 
ttttgccgtt 
aagccactgg 
cccataattg 
acaactttga 
tggagttcgt 
aaggaaataa 
ataccgctgc 
agaaaatgaa 
tgtggaacgg 
cctgcacttt 
cctttgctcg 
ggagtgcatc 
agacagccgc 
cgaaaactgg 
gacggaaaag 
ctttgtgaaa 
caagtggtat 
gtatgtcgag 
ttatatttta 
agcaggagcg 
gcaagtattt 
acgagaagga 
tggacaccaa 



3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 
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ggcaccaggc 


gggtcaaatc 


aggaataagg 


36 

gcacattgcc 


ccggcgtgag 


tcggggcaat 


5700 


cccgcaagga 


Srggtgaatga 


atcggacgtt 


tgaccggaag 


gcatacaggc 


aagaactgat 


5760 


cgacgcgggg 


ttttccgccg 


aggatgccga 


aaccatcgca 


agccgcaccg 


tcatgcgtgc 


5820 


gccccgcgaa 


accttccagt 


ccgtcggctc 


gatggtccag 


caagctacgg 


ccaagatcga 


5880 


gcgcgacagc 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 


ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag 


tcgatgacca 


tcgacacgcg 


6000 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gacctggcaa 


aacaggtcag 


6060 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag 


cagatcaagg 


aaatgcagct 


612 0 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


6180 


ccgctctgcc 


ctgttcacca 


cgcgcaacaa 


gaaaatcccg 


cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


agctgcgggc 


6300 


cgacgatgac 


gaactggtgt 


ggcagcaggt 


gttggagtac 


gcgaagcgca 


cccctatcgg 


6360 


cgagccgatc 


accttcacgt 


tctacgagct 


ttgccaggac 


ctgggctggt 


cgatcaatgg 


6420 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg 


cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggtgtcgctg 


ctgcaccgct 


tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt 


cccgttgcca 


ggtcctgatc 


gacgaggaaa 


tcgtcgtgct 


6600 


gtttgctggc 


gaccactaca 


cgaaattcat 


atgggagaag 


taccgcaagc 


tgtcgccgac 


6660 


ggcccgacgg 


atgttcgact 


atttcagctc 


gcaccgggag 


ccgtacccgc 


tcaagctgga 


6720 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgtg 


aagaagtggc 


gcgagcaggt 


6780 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcct 


gggtcaatga 


6840 


tgacctggtg 


cattgcaaac 


gctagggcct 


tgtggggtca 


gttccggctg 


ggggttcagc 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcact 


gctcgacgca 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


tacgaactgc 


cgataaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt 


gcaggatttc 


7080 


cgcgagatcc 


gattgtcggc 


cctgaagaaa 


gctccagaga 


tgttcgggtc 


cgtttacgag 


7140 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc 


cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga 


ggacggcccc 


7260 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt 


tattgctcgt 


gatgatcgtc 


7380 


cgacagattc 


caacgggaat 


ctggtggatg 


cgcatcttca 


tcctcggcgc 


acttaatatt 


7440 


tcgctattct 


ggagcttgtt 


gtttatttcg 


gtctaccgcc 


tgccgggcgg 


ggtcgcggcg 


7500 



10 



20 
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acggtaggcg ctgtgcagcc gctgatggtc gtgttcatct ctgccgctct . gctaggtagc 7560 

ccgatacgat tgatggcggt cctgggggct atttgcggaa ctgcgggcgt ggcgctgttg 7620 

gtgttgacac caaacgcagc gctagatcct gtcggcgtcg cagcgggcct ggcgggggcg 7680 

gtttccatgg cgttcggaac cgtgctgacc. cgcaagtggc aacctcccgt gcctctgctc 7740 

acctttaccg cctggcaact ggcggccgga ggacttctgc tcgttccagt agctttagtg 7800 

tttgatccgc caatcccgat gcctacagga accaatgttc tcggcctggc gtggctcggc 7860 

ctgatcggag cgggtttaac ctacttcctt tggttccggg ggatctcgcg actcgaacct 7920 

15 acagttgttt ccttactggg ctttctcagc cccagatctg gggtcgatca gccggggatg 7980 

catcaggccg acagtcggaa cttcgggtcc ccgacctgta ccattcggtg agcaatggat 8040 

aggggagttg atatcgtcaa cgttcacttc taaagaaata gcgccactca gcttcctcag 8100 

cggctttatc cagcgatttc ctattatgtc ggcatagttc tcaagatcga cagcctgtca 8160 

cggttaagcg agaaatgaat aagaaggctg ataattcgga tctctgcgag ggagatgata 8220 

25 tttgatcaca ggcagcaacg ctctgtcatc gttacaatca acatgctacc ctccgcgaga 8280 

tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt ccgaatagca tcggtaacat 8340 

gagcaaagtc tgccgcctta caacggctct cccgctgacg ccgtcccgga ctgatgggct 8400 

gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg gggagctgtt ggctggctgg 8460 

tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 852 0 

35 gacgttttta atgtactggg gtggtttttc ttttcaccag tgagacgggc aacagctgat 8580 

tgcccttcac cgcctggccc tgagagagtt gcagcaagcg gtccacgctg gtttgcccca 8640 

gcaggcgaaa atcctgtttg atggtggttc cgaaatcggc aaaatccctt ataaatcaaa 8700 

agaatagccc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 8760 

gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 8820 

tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 

ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 

ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcaactgt tgggaagggc 9000 

gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060 

gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 

55 aattaattcc catcttgaaa gaaatatagt ttaaatattt attgataaaa taacaagtca 9180 

ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagaaatatt 9240 

tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 9300 

tgtgtaatac ataaattgat gatatagcta gcttagctca tcgggggatc cgtcgaagct 9360 



40 



50 



60 
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agcttgggtc 


ccgctcagaa. gaactcgtca agaaggcgat agaaggcgat 


gcgctgcgaa 


942 0 


tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc 


gccaagctct 


9480 


tcagcaatat 


cacgggtagc caacgctatg tcctgatagc ggtccgccac 


acccagccgg 


9540 


ccacagtcga 


tgaatccaga aaagcggcca ttttccacca tgatattcgg 


caagcaggca 


9600 


tcgccatggg 


tcacgacgag atcctcgccg tcgggcatgc gcgccttgag 


cctggcgaac 


9660 


agttcggctg 


gcgcgagccc ctgatgctct tcgtccagat catcctgatc 


gacaagaccg 


9720 


gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc 


gaatgggcag 


9780 


gtagccggat 


caagcgtatg cagccgccgc attgcatcag ccatgatgga 


tactttctcg 


9840 


gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa 


tagcagccag 


9900 


tcccttcccg 


cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc 


cgtcgtggcc 


9960 


agccacgata 


gccgcgctgc ctcgtcctgc agttcattca gggcaccgga 


caggtcggtc 


10020 


ttgacaaaaa 


gaaccgggcg cccctgcgct gacagccgga acacggcggc 


atcagagcag 


10080 


ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc 


ggccggagaa 


10140 


cctgcgtgca 


atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 


10200 


tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt 


atggaacgtc 


10260 


agtggagcat 


ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 


10320 


acgcgcaata 


atggtttctg acgtatgtgc ttagctcatt aaactccaga 


aacccgcggc 


10380 


tgagtggctc 


cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg 


cttgtcccgc 


10440 


gtcatcggcg 


ggggtcataa cgtgactccc ttaattctcc gctcatgatc 


ttgatcccct 


10500 


gcgccatcag 


atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 


10560 


cttaccagag 


ggcgccccag ctggcaattc cggttcgctt gctgtccata 


aaaccgccca 


10620 


gtctagctat 


cgccatgtaa gcccactgca agctacctgc tttctctttg 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 


10740 


actggctttc 


tacgtgttcc gcttccttta gcagcccttg cgccctgagt 


gcttgcggca 


10800 


gcgtgaagct 


tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa cccttgtaat ttgtttttgt tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt tatatttggt actaaattta taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt tgcaagttga ttaattgatt ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaatcaac tggaaatgta aatatttgct aatatttcta 


ctataggaga 


11100 


attaaagtga 


gtgaatatgg taccacaagg tttggagatt taattgttgc 


aatgctgcat 


11160 


ggatggcata 


tacaccaaac attcaataat tcttgaggat aataatggta 


ccacacaaga 


11220 
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tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 

taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 

tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 

aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 

ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 



agccagccca ccgcggtgga aa atg gag gtc gtg gag aga ttc tac ggt gag 11572 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu 
1 5 10 

2 S S 2 2 2 S E 2 22 S 2 2 s S £ 11620 
If? 2 H 2 £ 2 S 2 £ £ 2 S S S 2 2 »««• 

gac agt ccc aca ccc ate gtc etc oat crt-t- t-r<*- *.4_ 

Asp Ser Pro Thr Pro He Val Leu Sly 52 Ser ?2 Tyr J2 £ Ke 11?1S 
45 50 



2 S S S 2 2 2 2 2 S 2 2 2 2 S S 11764 

65 70 

S 2 S S 2 2 2 S£ S 2 2 2 2 2 2 2 11812 

80 gs 



90 



ttc tgt ttt gcg etc agt ctg tat atg tgc gtg ggc ate act t*t- ^ n 
Phe Cys Phe Ala Leu Ser Leu Tyr Me? cjs ?a? Sy S S Tyr Gin 
95 100 105 



IT ^° tff9 Cgg taC tCt ctc fc W ggc aat gca tac aat cct aaa 

Ala He Thr Trp Arg Tyr Ser Leu Trp Gly Asn Ala Tyr Asn Pro lys 

XX " 115 120 

cat aaa gag atg gcg att ctg gta tac ttg ttc tac atg tct aaa tac 
His Lys Glu Met Ala He Leu Val Tyr Leu Phe Tyr Me? Ser lyl £r 

130 2.35 

gtg gaa ttc atg gat acc gtt ate atg ata ctg aag cgc age acc aaa 
Val Glu Phe Met Asp Thr Val He Met He Leu Ly? A?g sir Thr S 
* u 145 150 

caa ata age ttc ctc cac gtt tat cat cat tct tea att tec ctc att 
Gin He Ser Phe Leu His Val Tyr His His Ser Ser He Ser Leu He 

165 170 

tgg tgg get att get cat cac get cct ggc ggt aaa crca ^t- t-™ 
Trp Trp Ala lie Ala His His Ala Pro S S K S S £ 

175 180 185 

gcg get ctg aac tea gga gtg cat gtt ctc atg tat gcg tat tac ttc 
Ala Ala Leu Asn Ser Gly Val His Val Leu Me? Tyr S £r £j 

195 200 



11860 



11908 



11956 



12004 



12052 



12100 



12148 
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ttg get gcc tgc ctt cga agt age cca aag tta aaa aat aag tac ctt 12196 
Leu Ala Ala Cys Leu Arg Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu 
205 210 215 

ttt tgg ggc agg tac ttg aca caa ttc caa atg ttc cag ttt atg ctg 12244 
Phe Trp Gly Arg Tyr Leu Thr Gin Phe Gin Met Phe Gin Phe Met Leu 
220 225 230 

aac tta gtg cag get tac tac gac atg aaa acg aat gcg cca tat cca 12292 
Asn Leu Val Gin Ala Tyr Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro 
235 240 245 250 

caa tgg ctg ate aag att ttg ttc tac tac atg ate teg ttg ctg ttt 12340 
Gin Trp Leu lie Lys lie Leu Phe Tyr Tyr Met lie Ser Leu Leu Phe 
15 255 260 265 

ctt ttc ggc aat ttt tac gta caa aaa tac ate aaa ccc tct gac gga 12388 
Leu Phe Gly Asn Phe Tyr Val Gin Lys Tyr lie Lys Pro Ser Asp Gly 
2Q 270 275 280 

aag caa aag gga get aaa act gag tga tctagaaggc ctcctgcttt 12435 
Lys Gin Lys Gly Ala Lys Thr Glu 
285 290 



"^25 


aatgagatat 


gcgagacgcc 


tatgatcgea 


tgatatttgc 


tttcaattct 


gttgtgcacg 


12495 




ttgtaaaaaa 


cctgagcatg 


tgtagctcag 


atccttaccg 


ccggtttcgg 


ttcattctaa 


12555 


30 


tgaatatatc 


acccgttact 


ategtatttt 


tatgaataat 


attctcegtt 


caatttactg 


12615 




attgtccgtc 


gagcaaattt 


acacattgcc 


actaaaegtc 


taaacccttg 


taatttgttt 


12675 




ttgttttact 


atgtgtgtta 


tgtatttgat 


ttgcgataaa 


tttttatatt 


tggtactaaa 


12735 


35 


tttataacac 


ettttatget 


aacgtttgcc 


aacacttagc 


aatttgcaag 


ttgattaatt 


12795 




gattctaaat 


tatttttgtc 


ttctaaatac 


atatactaat 


caactggaaa 


tgtaaatatt 


12855 


40 


tgctaatatt 


tctactatag 


gagaattaaa 


gtgagtgaat 


atggtaccac 


aaggtttgga 


12915 




gatttaattg 


ttgeaatget 


gcatggatgg 


catatacacc 


aaacattcaa 


taattcttga 


12975 




ggataataat 


ggtaccacac 


aagatttgag 


gtgeatgaac 


gtcacgtgga 


caaaaggttt 


13035 


1 


agtaattttt 


caagacaaca 


atgttaccac 


acacaagttt 


tgaggtgcat 


gcatggatgc 


13095 




cctgtggaaa 


gtttaaaaat 


attttggaaa 


tgatttgeat 


ggaagccatg 


tgtaaaacca 


13155 


50 


tgacatccac 


ttggaggatg 


caataatgaa 


gaaaactaca 


aatttacatg 


caactagtta 


13215 




tgcatgtagt 


ctatataatg 


aggattttgc 


aatactttca 


ttcatacaca 


ctcactaagt 


13275 




tttacacgat 


tataatttct 


teatagecag 


eggatec atg gta ttc gcg ggc ggt 


13330 



55 Met Val Phe Ala Gly Gly 



60 



295 



gga ctt cag cag ggc tct etc gaa gaa aac ate gac gtc gag cac att 13378 
Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn He Asp Val Glu His He 
300 305 310 

gcc agt atg tct etc ttc age gac ttc ttc agt tat gtg tct tea act 13426 
Ala Ser Met Ser Leu Phe Ser Asp Phe Phe Ser Tyr Val Ser Ser Thr 



BASF Plant Science GmbH 



20030015 



PF 54305 DE 



41 

315 320 325 

gtt ggt teg tgg age gta cac agt ata caa cct ttg aag cgc ctg acg 13 474 
Val Gly ser Trp Ser Val His Ser lie Gin Pro Leu Lys Arg Leu Thr 
330 335 340 

agt aag aag cgt gtt teg gaa age get gee gtg caa tgt ata tea get 13522 
Ser Lys Lys Arg Val Ser Glu Ser Ala Ala Val Gin Cys He Ser Ala 
345 350 355 360 

gaa gtt cag aga aat teg agt ace cag gga act gcg gag gca etc gca 13570 
Glu Val Gin Arg Asn Ser Ser Thr Gin Gly Thr Ala Glu Ala Leu Ala ~" ~ * 
365 370 375 

gaa tea gtc gtg aag ccc acg aga cga agg tea tct cag tgg aag aag 13618 
Glu Ser val Val Lys. Pro Thr Arg Arg Arg Ser Ser Gin Trp Lys Lys 
3 80 385 390 

teg aca cac cec eta tea gaa gta gca gta cac aac aag cca age gat 
Ser Thr His Pro Leu Ser Glu Val Ala Val His Ash Lys Pro Ser Asp 
395 400 405 



13666 



tgc tgg att gtt gta aaa aac aag gtg tat gat gtt tec aat ttt gcg 13714 
Cys Trp He Val Val Lys Asn Lys Val Tyr Asp Val Ser Asn Phe Ala 
410 415 420 

gac gag cat ccc gga gga tea gtt att agt act tat ttt gga cga gac 13762 
Asp Glu Hxs Pro Gly Gly Ser Val He Ser Thr Tyr Phe Gly Arg Asp 
425 430 435 440 

ggc aca gat gtt ttc tct agt ttt cat gca get tct aca tgg aaa att 13810 
Gly Thr Asp Val Phe Ser Set Phe His Ala Ala Ser Thr Trp Lys He 
445 450 455 

ctt caa gac ttt tac att ggt gac" gtg gag agg gtg gag ccg act cca 13858 
Leu Gin Asp Phe Tyr He Gly Asp Val Glu Arg Val Glu Pro Thr Pro 
460 465 470 

gag ctg ctg aaa gat ttc cga gaa atg aga get ctt ttc ctg agg gag 13906 
Glu Leu Leu Lys Asp Phe Arg Glu Met Arg Ala Leu Phe Leu Arg Glu 
475 480 485 

caa ctt ttc aaa agt teg aaa ttg tac tat gtt atg aag ctg etc acg 13 954 
Gin Leu Phe Lys ser Ser Lys Leu Tyr Tyr Val Met Lys Leu Leu Thr 
490 495 500 

S?* t ^ t gCt 3Cg a9 ° att gca ata ata W age aag 14002 

Asn Val Ala He Phe Ala Ala Ser He Ala He He Cys Trp Ser Lys 
505 510 515 520 

act att tea gcg gtt ttg get tea get tgt atg atg get ctg tgt ttc 14050 
Thr He ser Ala Val Leu Ala Ser Ala Cys Met Met Ala Leu Cys Phe 
525 530 535 

caa cag tgc gga tgg eta tec cat gat ttt etc cac aat cag gtg ttt 14098 
Gin Gin Cys Gly Trp Leu Ser His Asp Phe Leu His Asn Gin Val Phe 
540 545 550 

gag aca cgc tgg ctt aat gaa gtt gtc ggg tat gtg ate ggc aac gee 14146 
Glu Thr Arg Trp Leu Asn Glu Val Val Gly Tyr Val He Gly Asn Ala 
555 560 565 



BASF Plant Science GmbH 



20030015 



PF 54305 DE 



42 

gtt ctg ggg ttt agt aca ggg tgg tgg aag gag aag cat aac ctt cat 
Val Leu Gly Phe Ser Thr Gly Trp Trp Lys Glu Lys His Asn Leu His 
570 575 580 

cat get get cca aat gaa tgc gat cag act tac caa cca att gat gaa 
His Ala Ala Pro Asn Glu Cys Asp Gin Thr Tyr Gin Pro lie Asp Glu ' 
585 590 595 600 

gat att gat act etc ccc etc att gee tgg age aag gac ata ctg gee 
Asp He Asp Thr Leu Pro Leu He Ala Trp Ser Lys Asp He Leu Ala 
605 610 615 

aca gtt gag aat aag aca ttc ttg cga ate etc caa tac cag cat ctg 
Thr Val Glu Asn Lys Thr Phe Leu Arg He Leu Gin Tyr Gin His Leu 
620 625 63 0 

ttc ttc atg ggt ctg tta ttt ttc gee cgt ggt agt tgg etc ttt tgg 
Phe Phe Met Gly Leu Leu Phe Phe Ala Arg Gly Ser Trp Leu Phe Trp 
635 640 645 

age tgg aga tat ace tct aca gca gtg etc tea cct gtc gac agg ttg 
Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu Ser Pro Val Asp Arg Leu 
650 655 660 

ttg gag aag gga act gtt ctg ttt cac tac ttt tgg ttc gtc ggg aca 
Leu Glu Lys Gly Thr Val Leu Phe His Tyr Phe Trp Phe Val Gly Thr 
665 670 675 680 

gcg tgc tat ctt etc cct ggt tgg aag cca tta gta tgg atg gcg gtg 
Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro Leu Val Trp Met Ala Val 
685 690 695 

act gag etc atg tec ggc atg ctg ctg ggc ttt gta ttt gta ctt age 
Thr Glu Leu Met Ser Gly Met Leu Leu Gly Phe Val Phe Val Leu Ser 
700 705 710 

cac aat ggg atg gag gtt tat aat teg tct aaa gaa ttc gtg agt gca 
His Asn Gly Met Glu Val Tyr Asn Ser Ser Lys Glu Phe Val Ser Ala 
715 720 725 

cag ate gta tec aca egg gat ate aaa gga aac ata ttc aac gac tgg 
Gin He Val Ser Thr Arg Asp He Lys Gly Asn He Phe Asn Asp Trp 
730 735 740 

ttc act ggt ggc ctt aac agg caa ata gag cat cat ctt ttc cca aca 
Phe Thr Gly Gly Leu Asn Arg Gin He Glu His His Leu Phe Pro Thr 
745 750 755 760 

atg ccc agg cat aat tta aac aaa ata gca cct aga gtg gag gtg ttc 
Met Pro Arg His Asn Leu Asn Lys He Ala Pro Arg Val Glu Val Phe 
765 770 775 

tgt aag aaa cac ggt ctg gtg tac gaa gac gta tct att get acc ggc 
Cys Lys Lys His Gly Leu Val Tyr Glu Asp Val Ser He Ala Thr Gly 
780 785 790 

act tgc aag gtt ttg aaa gca ttg aag gaa gtc gcg gag get gcg gca 
Thr Cys Lys Val Leu Lys Ala Leu Lys Glu Val Ala Glu Ala Ala Ala 
795 800 805 



gag cag cat get acc acc agt taa getagegtta accctgcttt aatgagatat 
Glu Gin His Ala Thr Thr Ser 
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810 815 

gcgagacgcc tatgatcgca tgatatttgc tttcaattct gttgtgcacg ttgtaaaaaa 14980 

cctgagcatg tgtagctcag atccttaccg ccggtttcgg ttcattctaa tgaatatatc 15040 

acccgttact atcgtatttt tatgaataat attctccgtt caatttactg attgtccgtc 15100 

gagcaaattt acacattgcc actaaacgtc taaacccttg taatttgttt ttgttttact 15160 

atgtgtgtta tgtatttgat ttgcgataaa tttttatatt tggtactaaa tttataacac 15220 

cttttatgct aacgtttgcc aacacttagc aatttgcaag ttgattaatt gattctaaat 15280 

tatttttgtc ttctaaatac atatactaat caactggaaa tgtaaatatt tgctaatatt 15340- 

tctactatag gagaattaaa gtgagtgaat atggtaccac aaggtttgga gatttaattg 15400 

ttgcaatgct gcatggatgg catatacacc aaacattcaa taattcttga ggataataat 15460 

ggtaccacac aagatttgag gtgcatgaac gtcacgtgga caaaaggttt agtaattttt 15520 

caagacaaca atgttaccac acacaagttt tgaggtgcat gcatggatgc cctgtggaaa 15580 

gtttaaaaat attttggaaa tgatttgcat ggaagccatg tgtaaaacca tgacatccac 15640 

ttggaggatg caataatgaa gaaaactaca aatttacatg caactagtta tgcatgtagt 15700 

ctatataatg aggattttgc aatactttca ttcatacaca ctcactaagt tttacacgat 15760 

tataatttct tcatagcoag cagatctaaa atg get ccg gat gcg gat aag ctt 15814 

Met Ala Pro Asp Ala Asp Lys Leu 
820 

cga caa cgc cag acg act gcg gta gcg aag cac aat get get acc ata 15862 
Arg Gin Arg Gin Thr Thr Ala Val Ala Lys His Asn Ala Ala Thr He 
825 830 835 

teg acg cag gaa cgc ctt tgc agt ctg tct teg etc aaa ggc gaa gaa 15910 
Ser Thr Gin Glu Arg Leu Cys Ser Leu Ser Ser Leu Lys Gly Glu Glu 
840 845 850 855 

gtc tgc ate gac gga ate ate tat gac etc caa tea ttc gat cat cec 15958 
Val Cys He Asp Gly He He Tyr Asp Leu Gin Ser Phe Asp His Pro 
860 865 870 

ggg ggt gaa acg ate aaa atg ttt ggt ggc aac gat gtc act gta cag 16006 
Gly Gly Glu Thr He Lys Met Phe Gly Gly Asn Asp Val Thr Val Gin 
875 880 885 

tac aag atg att cac cog tac cat acc gag aag cat ttg gaa aag atg 16054 
Tyr Lys Met He His Pro Tyr His Thr Glu Lys His Leu Glu Lys Met 
890 895 " 900 

aag cgt gtc ggc aag gtg acg gat ttc gtc tgc gag tac aag ttc gat 16102 
Lys Arg Val Gly Lys Val Thr Asp Phe Val Cys Glu Tyr Lys Phe Asp 
905 910 915 

acc gaa ttt gaa cgc gaa ate aaa cga gaa gtc ttc aag att gtg cga 16150 
Thr Glu Phe Glu Arg Glu He Lys Arg Glu Val Phe Lys He Val Arg 
920 925 930 935 
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2£ f a9 f at ^ C ggt act ttg gga ttc ttc cgt gcg ttt tgc 

Arg Gly Lys Asp Phe Gly Thr Leu Gly Trp Phe Phe Arg LI Phe c?s 

940 945 

S Se £a SS S 2° I"" ^ Cat tgg gtC acc acg ^ a 

Tyr lie Ala lie Phe Phe Tyr Leu Gin Tyr His Trp Val Thr Thr Gly 

955 960 965 

acc tct tgg ctg ctg gcc gtg gcc tac gga ate tec caa gcg ate att 
Thr Ser Trp Leu Leu Ala Val Ala Tyr Gly He Ser Gin S X? Se 
. 970 975 9 8 o 

ggc atg aat gtc cag cac gat gcc aac cac ggg gcc acc tec «„ c nt - 
Gly Met Asn Val Gin His Asp Ala Asn His Sg Ala Sr Ser Lys Arg 

aac gac at ^ cta etc ggt gcg gat ttt att ggt 

SSo P ioS 5 Leu Gly Leu Gly Jjj Asp Phe Ile Sly 

ggt tec aag tgg etc tgg cag gaa caa cac tgg acc cae cac get 
Gly Ser Lys Trp Leu Trp Gin Glu Gin His TrJ Thr His His E 
1015 1020 10 25 

tac acc aat cac . gcc gag atg gat ccc gat age ttt ggt gcc gaa 
Tyr Thr Asn His Ala Glu Met Asp Pro Asp Ser Phe S?y £a Su 
1030 1035 10 40 

£o 22 T CtC r Cta ^ C aaC gaC tat CCC ttg « at cat get cgt 

Pro__ Met Leu Leu Phe Asn^ Asp Tyr Pro Leu Asp_ His Pro La Arg 

acc tgg eta cat cgc ttt caa gca ttc ttt tac atg ccc gtc tta 
Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Me? Pro vS S 
1060 1065 !070 

IT ^ ^f C ttg tC ° gCt gtC ttC aat cca caa a tt ctt gac 

Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin lie Leu Asp 

1075 1080 1085 



etc cag caa cgc ggc gca ctt tec gtc ggt ate cgt etc aac aac 
Leu Gin Gin Arg Gly Ala Leu Ser Val S?y xie S Leu Kp Asn 
1090 1095 noo 



?? t 11° tCg ° ga ° gC aag tat gcg fftt "<= tgg egg get 

Ills H±S So Arg LYS Ala *S S Xa 

vll S f ? g gtg att gCt CCg tfct tac aca a ^ tec 

So Val Ile Ala Pro Phe Thr As * Ser 

1120 H25 1X30 

ggc etc gaa tgg tec tgg cgt gtc ttt gga aac ate atg etc atg 
Gly Leu Glu Trp Ser Trp Arg Val Phe Gly Asn lie Me? LeS X? 
1135 H40 1145 

ggt gtg gcg gaa teg etc gcg ctg gcg gtc ctg ttt teg ttg tea 
Gly val Ala Glu Ser Leu Ala Leu Ala Val Le? Phe Se? 2 Se? 
1150 H55 1160 



16198 



16246 



16294 



16342 



16387 



16432 



16477 



16522 



16567 



16612 



16657 



16702 



16747 



16792 



16837 



cac aat ttc gaa tec gcg 
His Asn Phe Glu Ser Ala 



gat cgc gat ccg acc 
Asp Arg Asp Pro Thr 



gcc cca ctg aaa 
Ala Pro Leu Lys 



16882 
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1165 



1170 



1175 



aag acg gga gaa cca gtc gac tgg ttc aag aca cag gtc gaa act 
Lys Thr Gly Glu Pro Val Asp Trp Phe Lys Thr Gin Val Glu Thr 
1180 1185 1190 



16927 



10 



15 



tec tgc act tac ggt gga ttc ctt tec ggt tgc ttc acg gga ggt 16972 

Ser Cys Thr Tyr Gly Gly Phe Leu Ser Gly Cys Phe Thr Gly Gly 

1195 1200 1205 

etc aac ttt cag gtt gaa cac cac ttg ttc cca cgc atg age age 17017 

Leu Asm Phe Gin Val Glu His His Leu Phe Pro Arg Met Ser Ser 

1210 1215 1220 

get tgg tat ccc tac att gee ccc aag gtc cgc gaa att tgc gee 17062 

Ala Trp Tyr Pro Tyr lie Ala Pro Lys Val Arg Glu lie Cys Ala 

1225 1230 1235 



20 



aaa cac ggc gtc cac tac gee tac tac ccg tgg ate cac caa aac 17107 

Lys His Gly Val His Tyr Ala Tyr Tyr Pro Trp lie His Gin Asn 

1240 1245 1250 

ttt etc tec acc gtc cgc tac atg cac gcg gee ggg acc ggt gee 17 '152 

Phe Leu Ser Thr Val Arg Tyr Met His Ala Ala Gly Thr Gly Ala 

1255 1260 1265 



30 



35 



40 



aac tgg cgc cag atg gee aga gaa aat ccc ttg acc gga egg gcg 
Asn Trp Arg Gin Met Ala Arg Glu Asn Pro Leu Thr Gly Arg Ala 
1270 1275 1280 



17197 



50 



taa agatctgecg gcatcgatcc egggecatgg ectgetttaa tgagatatgc 


17250 


gagacgecta 


tgatcgcatg 


atatttgett 


tcaattctgt 


tgtgcacgtt 


gtaaaaaacc 


17310 


tgagcatgtg 


tagctcagat 


ccttaccgcc 


ggtttcggtt 


cattctaatg 


aatatatcac 


17370 


ccgttactat 


cgtattttta 


tgaataatat 


tctccgttca 


atttactgat 


tgtcegtega 


17430 


cgagctcggc 


gcgcctctag 


aggatcgatg 


aattcagatc 


ggctgagtgg 


ctccttcaac 


17490 


gttgcggttc 


tgtcagttcc 


aaacgtaaaa 


cggcttgtcc 


cgcgtcatcg 


gegggggtea 


17550 


taacgtgact 


cccttaattc 


tccgctcatg 


atcagattgt 


cgtttcccgc 


cttcagttta 


17610 


aactatcagt 


gtttgacagg 


atatattggc 


gggtaaacct 


aagagaaaag 


agegtttatt 


17670 


agaataatcg 


gatatttaaa 


agggcgtgaa 


aaggtttatc 


cttcgtccat 


ttgtatgtgc 


17730 


atgccaacca 


cagggttccc 


ca 








17752 



55 



<210> 20 

<211> 290 

<212> PRT 

<213> Phaeodactylum tricornutum, Physcomitrella patens 

<400> 20 



Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
60 1 5 10 15 



BASF Plant Science GmbH 2003001 5 pf 54305 DE 



46 



Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly val Glu Leu Thr Asp 



25 



30 



5 Thr Pro Thr Thr Lys Gly 
35 



Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
40 45 



10 S U LSU Thr Ile Val Ile Gly Leu Leu 

ou 55 60 



Trp Ile Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Le 
oi> 70 
15 75 80 



20 




Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
85 90 95 

Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala lie Thr Trp Arg Tyr 

105 no 



25 ser Leu Trp Gly 



An Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 
115 120 125 



30 



Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
"0 135 



140 



35 



Val Ile Met He Leu Lys Arg Ser Thr Arg Gin He Ser Phe 
145 150 155 



Leu His 
160 



Val Tyr His His Ser Ser Ile Ser Leu Ile Trp Trp Ala ile Ala 



165 



170 



His 



175 



40 



His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 



185 



190 



5 val His val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala cys Leu Arg 



200 



205 



Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe 
ou 210 215 



Trp Gly Arg Tyr Leu 
220 



Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
55 230 235 240 

Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu Ile Lys lie 
245 250 255 



60 

Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
260 265 270 
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Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 



280 



285 



10 



15 



20 



Thr Glu 
290 



<210> 21 
<211> 525 
<212> PRT 

<213> Phaeodactylum tricornutum, Physcomitrella patens 
<400> 21 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly ser Leu Glu Glu Asn 



10 



15 




He Asp val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 



25 



30 



Ser OVr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin 



40 



45 



30 Pro Leu 



eu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 



60 



35 X 1 I1S SSr " a G1U VaI Gln As * Ser Ser Thr Gin Gly 

70 75 80 



40 



Thr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg 
85 go 



Arg Arg 
95 



His Pro Leu Ser Glu Val Ala Val 
105 2.10 



Ser Ser Gin Trp Lys Lys Ser Thr 
100 

His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn Lys Val Tyr 
115 120 125 

50 Asp Val ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val He 
55 ITs *** ^ GlY *** GlY Thr ASP Val »J s ^ Ser Phe His Ala 



Ser 



155 



160 



Ala Ser Thr Trp Lys He Leu Gin 



60 



As P phe He Gly Asp Val Glu 

165 170 175 

Arg val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
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180 



185 



190 



^ Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys ser Ser Lys Leu Tyr Tyr 



10 



Val Met Lys Leu Leu Thr Asn Val Ala lie Phe Ala Ala Ser He Ala 

215 220 



lie He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 



230 



235 



240 



15 



Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 • 255 




20 Leu His Asn Gin Val 
260 



Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
265 270 



25 



Tyr Val lie Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 



280 



285 



30 



G1U ^ H±S ASn LeU His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 
290 295 300 



Tyr Gin Pro He Asp Glu Asp He Asp Thr Leu Pro Leu He Ala Trp 



310 



315 



320 



35 



Ser Lys Asp He Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 
325 3 3 o . 335 



40 Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 



350 




Gly .ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val 



355 



360 



Leu 



365 



50 



Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370 375 380 



385 ^ ^ ^ LSU - SU Pr ° Gly Pro 



390 



395 



400 



55 



Leu Val Trp Met Ala Val Thr Glu Leu Met. Ser Gly Met Leu Leu Gly 
405 410 415 



60 Phe val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 
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Lys Glu Phe Val Ser Ala Gin lie Val Ser Thr Arg Asp He Lys Gly 
43 * 440 445 

Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 
450 455 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 47 ° 475 " 480 

Pro Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
4 85 490 495 

Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 505 510 

Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515 520 525 

<210> 22 

<211> 469 

<212> PRT 

<213> Phaeodactylum tricorautum, Physcomitrella patens 

<400> 22 

Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val 
1 5 10 15 

Ala Lys His Asn Ala Ala Thr He Ser Thr Gin Glu Arg Leu Cys Ser 
20 25 30 

Leu Ser Ser Leu Lys Gly Glu Glu Val Cys He Asp Gly He He Tyr 
35 40 45 

Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe 
50 55 60 

Gly Gly Asn Asp Val Thr Val Gin Tyr Lys Met He His Pro Tyr His 
65 70 75 80 

Thr Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp 
85 90 95 

Phe Val Cys Glu Tyr Lys Phe Asp Thr Glu Phe Glu Arg Glu He Lys 
100 105 no 



Arg Glu Val Phe Lys He Val Arg Arg Gly Lys Asp Phe Gly Thr Leu 
115 120 125 
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Gly Trp Phe Phe Arg Ala Phe Cys Tyr lie Ala He Phe Phe Tyr Leu 
130 135 140 

Gin Tyr His Trp Val Thr Thr Gly Thr Ser Trp Leu Leu Ala Val Ala 
145 15 ° 155 160 

Tyr Gly He Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ala 
165 170 175 

Asn His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly 
180 185 190 

Leu Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin 
195 200 205 

His Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp 
210 215 220 

Ser Phe Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp 
225 230 235 2 40 

His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met 
245 250 255 

Pro Val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
260 265 270 

Leu Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 
27 5 280 285 

Asn Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala 
2 90 295 300 

Val Tyr He Ala Val Asn Val He Ala Pro Phe Tyr Thr Asn Ser Gly 
305 310 315 320 

Leu Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val 
325 330 335 

Ala Glu Ser Leu Ala Leu Ala Val Leu Phe Ser Leu Ser His Asn Phe 
340 345 350 



Glu Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu 
355 360 365 
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Pro Val Asp Trp Phe Lys Thr Girt Val Glu Thr Ser Cys Thr Tyr Glv 
370 375 . 380 

5 Gly Phe Leu Ser Gly Cys Phe Thr Gly Gly Leu Asn Phe Gin Val Glu 
385 390 395 400 

His His Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr He Ala 
10 405 410 415 



15 



20 





Pro Lys Val Arg Glu He Cys Ala Lys His Gly Val His Tyr Ala Tyr 
420 425 430 

Tyr Pro Trp He His Gin Asn Phe Leu Ser Thr Val Arg Tyr Met His 
435 440 445 

Ala Ala Gly Thr Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro 
450 455 460 



26 



25 Leu. Thr Gly Arg Ala 
465 

<210> 23 
30 <211> 26 
<212> DBIA 

<213> artificial sequence 

<400> 23 
35 gaattcggcg cgccgagctc ctcgag 

<210> 24 

<211> 265 

40 <212> DNA 

<213> artificial sequence 

<400> 24 

ccaccgcggt gggcggccgc ctgcagtcta gaaggcctcc tgctttaatg agatatgcga 60 

gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 120 

agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 180 

50 gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg tccgtcgacg 240 

aattcgagct cggcgcgcca agctt 265 

55 <210> 25 
<211> 257 
<212> DNA 

<213> artificial sequence 
60 <400> 25 

ggatccgata tcgggcccgc tagcgttaac cctgctttaa tgagatatgc gagacgccta 60 
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tgatcgcatg atatttgctt tcaattctgt tgtgcacgtt gtaaaaaacc tgagcatgtg 
tagctcagat ccttaccgcc ggtttcggtt cattctaatg aatatatcac ccgttactat 
cgtattttta tgaataatat tctccgttca atttactgat .tgtccgtcga cgaattcgag 
ctcggcgcgc caagctt 



<210> 26 

<211> 5410 

<212> DMA 

<213> artificial sequence 



120 
180 
240 
257 



<400> 26 

ttttggaaat gatttgcatg gaagccatgt 



aataatgaag aaaactacaa atttacatgc 
ggattttgca atactttcat tcatacacac 
catagccagc ggatccgata tcgggcccgc 
gagacgccta tgatcgcatg atatttgctt 
tgagcatgtg tagctcagat ccttaccgcc 
ccgttactat cgtattttta tgaataatat 
gcaaatttac acattgccac taaacgtcta 
gtgtgttatg tatttgattt gcgataaatt 
tttatgctaa cgtttgccaa cacttagcaa 
tttttgtctt ctaaatacat atactaatca 
tactatagga gaattaaagt gagtgaatat 
gcaatgctgc atggatggca tatacaccaa 
taccacacaa gatttgaggt gcatgaacgt 
agacaacaat gttaccacac acaagttttg 
ttaaaaatat tttggaaatg atttgcatgg 
ggaggatgca ataatgaaga aaactacaaa 
atataatgag gattttgcaa tactttcatt 
taatttcttc atagccagca gatctgccgg 
gagatatgcg agacgcctat gatcgcatga 
taaaaaacct gagcatgtgt agctcagatc 
atatatcacc cgttactatc gtatttttat 
gtccgtcgac gagctcggcg cgccaagctt 
gtgaaattgt tatccgctca caattccaca 



gtaaaaccat 
aactagttat 
tcactaagtt 
tagcgttaac 
tcaattctgt 
ggtttcggtt 
tctccgttca 
aacccttgta 
tttatatttg 
tttgcaagtt 
actggaaatg 
ggtaccacaa 
acattcaata 
cacgtggaca 
aggtgcatgc 
aagccatgtg 
tttacatgca 
catacacact 
catcgatccc 
tatttgcttt 
cttaccgccg 
gaataatatt 
ggcgtaatca 
caacatacga 



gacatccact 
gcatgtagtc 
ttacacgatt 
cctgctttaa 
tgtgcacgtt 
cattctaatg 
atttactgat 
atttgttttt 
gtactaaatt 
gattaattga 
taaatatttg 
ggtttggaga 
attcttgagg 
aaaggtttag 
atggatgccc 
taaaaccatg 
actagttatg 
cactaagttt 
gggccatggc 
caattctgtt 
gtttcggttc 
ctccgttcaa 
tggtcatagc 
gccggaagca 



tggaggatgc 
tatataatga 
ataatttctt 
tgagatatgc 
gtaaaaaacc 
aatatatcac 
tgtccgtcga 
gttttactat 
tataacacct 
ttctaaatta 
ctaatatttc 
tttaattgtt 
ataataatgg 
taatttttca 
tgtggaaagt 
acatccactt 
catgtagtct 
tacacgatta 
ctgctttaat 
gtgcacgttg 
attctaatga 
tttactgatt 
tgtttcctgt 
taaagtgtaa 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
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agcctggggt 
tttccagtcg 
aggcggtttg 
cgttcggctg 
atcaggggat 
taaaaaggcc 
aaatcgacgc 
tccccctgga 
gtccgccttt 
cagttcggtg 
cgaccgctgc 
atcgccactg 
tacagagttc 
ctgcgctctg 
acaaaccacc 
aaaaggatct 
aaactcacgt 
tttaaattaa 
cagttaccaa 
catagttgcc 
ccccagtgct 
aaaccagcca 
ccagtctatt 
caacgttgtt 
attcagctcc 
agcggttagc 
actcatggtt 
ttctgtgact 
ttgctcttgc 
gctcatcatt 
atccagttcg 



gcctaatgag 
ggaaacctgt 
cgtattgggc 
cggcgagcgg 
aacgcaggaa 
gcgttgctgg 
tcaagtcaga 
age tec c teg 
ctcccttcgg 
taggtegtte 
gccttatccg 
gcagcagcca 
ttgaagtggt 
ctgaagccag 
gctggtagcg 
caagaagatc 
taagggattt 
aaatgaagtt 
tgettaatea 
tgactccccg 
gcaatgatac 
geeggaaggg 
aattgttgcc 
gecattgeta 
ggttcccaac 
tccttcggtc 
atggcagcac 
Srgtgagtact 
ccggcgtcaa 
ggaaaacgtt 
atgtaaccca 



tgagctaact 
cgtgccagct 
gctcttccgc 
tatcagctca 
agaacatgtg 
cgtttttcca 
ggtggcgaaa 
tgcgctctcc 
gaagcgtggc 
gctccaagct 
gtaactatcg 
ctggtaacag 
ggectaacta 
ttaccttegg 
gtggtttttt 
ctttgatctt 
tggtcatgag 
ttaaatcaat 
gtgaggcacc 
tcgtgtagat 
cgcgagaccc 
ccgagcgcag 
gggaagctag 
caggcatcgt 
gatcaaggcg 
ctccgatcgt 
tgeataatte 
caaccaagtc 
tacgggataa 
etteggggeg 
ctcgtgcacc 



cacattaatt 
gcattaatga 
ttcctcgctc 
etcaaaggeg 
agcaaaaggc 
taggctccgc 
cccgacagga 
tgttccgacc 
gctttctcat 
gggctgtgtg 

tcttgagtcc 
gattagcaga 
cggctacact 
aaaaagagtt 
tgtttgcaag 
ttctacgggg 
attatcaaaa 
ctaaagtata 
tatctcagcg 
aactacgata 
acgctcaccg 
aagtggtcct 
agtaagtagt 
ggtgtcacgc 
agttacatga 
tgtcagaagt 
tcttactgtc 
attctgagaa 
taccgcgcca 
aaaactctca 
caactgatct 



gcgttgcgct 
atcggccaac 
actgactcgc 
gtaatacggt 
cagcaaaagg 
ccccctgacg 
ctataaagat 
ctgccgctta 
agctcacgct 
cacgaacccc 
aacceggtaa 
gcgaggtatg 
agaaggacag 
ggtagctctt 
cagcagatta 
tctgacgctc 
aggatcttca 
tatgagtaaa 
atctgtctat 
egggaggget 
gctccagatt 
gcaactttat 
tegecagtta 
tcgtcgtttg 
tcccccatgt 
aagttggccg 
atgccatccg 
tagtgtatgc 
catagcagaa 
aggatcttac 
tcagcatctt 



cactgcccgc 
gegeggggag 
tgcgctcggt 
tatccacaga 
ccaggaaccg 
agcatcacaa 
accaggegtt 
ccggatacct 
gtaggtatct 
ccgttcagcc 
gacacgactt 
taggcggtgc 
tatttggtat 
gatceggcaa 
cgcgcagaaa 
agtggaacga 
cctagatcct 
cttggtctga 
ttcgttcatc 
taccatctgg 
tatcagcaat 
ccgcctccat 
atagtttgcg 
gtatggcttc 
tgtgcaaaaa 
cagtgttatc 
taagatgett 
ggegaccgag 
ctttaaaagt 
cgctgttgag 
ttactttcac 



1500 

1560 

1620 

1680 

1740 

1800 * 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



60 



cagcgtttct 
gacacggaaa 
gggttattgt 
ggttccgcgc 
gacattaacc 
tgacggtgaa 
ggatgccggg 
ctggcttaac 
aataccgcac 
gcgcaactgt 
agggggatgt 
ttgtaaaacg 
ccactaaacg 
atttgcgata 
ccaacactta 
acatatacta 
aagtgagtga 
ggcatataca 
aggtgcatga 
acacacaagt 
aatgatttgc 
aagaaaacta 
gcaatacttt 
agcccaccgc 
cgagacgcct 
ctgagcatgt 
cccgttacta 
agcaaattta 
tgtgtgttat 
ttttatgcta 
atttttgtct 



gggtgagcaa 
tgttgaatac 
ctcatgagcg 
acatttcccc 
tataaaaata 
aacctctgac 
agcagacaag 
tatgcggcat 
agatgcgtaa 
tgggaagggc 
gctgcaaggc 
acggccagtg 
tctaaaccct 
aatttttata 
gcaatttgca 
atcaactgga 
atatggtacc 
ccaaacattc 
acgtcacgtg 
tttgaggtgc 
atggaagcca 
caaatttaca 
cattcataca 
ggtgggcggc 
atgatcgcat 
gtagctcaga 
tcgtattttt 
cacattgcca 
gtatttgatt 
acgtttgcca 
tctaaataca 



aaacaggaag 
tcatactctt 
gatacatatt 
gaaaagtgcc 
ggcgtatcac 
acatgcagct 
cccgtcaggg 
cagagcagat 
ggagaaaata 
gatcggtgcg 
gattaagttg 
aattcggcgc 
tgtaatttgt 
tttggtacta 
agttgattaa 
aatgtaaata 
acaaggtttg 
aataattctt 
gacaaaaggt 
atgcatggat 
tgtgtaaaac 
tgcaactagt 
cactcactaa 
cgcctgcagt 
gatatttgct 
tccttaccgc 
atgaataata 
ctaaacgtct 
tgcgataaat 
acacttagca 
tatactaatc 



gcaaaatgcc 
cctttttcaa 
tgaatgtatt 
acctgacgtc 
gaggcccttt 
cccggagacg 
cgcgtcagcg 
tgtactgaga 
ccgcatcagg 
ggcctcttcg 
ggtaacgcca 
gccgagctcc 
ttttgtttta 
aatttataac 
ttgattctaa 
tttgctaata 
gagatttaat 
gaggataata 
ttagtaattt 
gccctgtgga 
catgacatcc 
tatgcatgta 
gttttacacg 
ctagaaggcc 
ttcaattctg 
cggtttcggt 
ttctccgttc 
aaacccttgt 
ttttatattt 
atttgcaagt 
aactggaaat 



gcaaaaaagg 
tattattgaa 
tagaaaaata 
taagaaacca 
cgtctcgcgc 
gtcacagctt 
ggtgttggcg 
gtgcaccata 
cgccattcgc 
ctattacgcc 
gggttttccc 
tcgagcaaat 
ctatgtgtgt 
accttttatg 
attatttttg 
tttctactat 
tgttgcaatg 
atggtaccac 
ttcaagacaa 
aagtttaaaa 
acttggagga 
gtctatataa 
attataattt 
tcctgcttta 
ttgtgcacgt 
tcattctaat 
aatttactga 
aatttgtttt 
ggtactaaat 
tgattaattg 
gtaaatattt 



gaataagggc 
gcatttatca 
aacaaatagg 
ttattatcat 
gtttcggtga 
gtctgtaagc 
ggtgtcgggg 
tgcggtgtga 
cattcaggct 
agctggcgaa 
agtcacgacg 
ttacacattg 
tatgtatttg 
ctaacgtttg 
tcttctaaat 
aggagaatta . 
ctgcatggat 
acaagatttg 
caatgttacc 
atattttgga 
tgcaataatg 
tgaggatttt 
cttcatagcc 
atgagatatg 
tgtaaaaaac 
gaatatatca 
ttgtccgtcg 
tgttttacta 
ttataacacc 
attctaaatt 
gctaatattt 



3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 
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ctactatagg agaattaaag tgagtgaata tggtaccaca aggtttggag atttaattgt 
tgcaatgctg catggatggc atatacacca aacattcaat aattcttgag gataataatg 
gtaccacaca agatttgagg tgcatgaacg tcacgtggac aaaaggttta gtaatttttc 
aagacaacaa tgttaccaca cacaagtttt gaggtgcatg catggatgcc ctgtggaaag 
tttaaaaata 



<210> 27 

<211> 12093 

<212> DNA 

<213> artificial sequence 



<400> 27 

gatctggcgc cggccagcga gacgagcaag 



gcgcccagca caggtgcgca ggcaaattgc 
tagtgggcgg tgacgtcgtt cgagtgaacc 
ataatcaggc cgatgccgac agcgtcgagc 
atgttgggtt tcacgtctgg cctccggacc 
ttctttatca ctgataagtt ggtggacata 
tgacaaagtt gcagccgaat acagtgatcc 
gcgtagacgg tctgacgaca cgcaaactgg 
tttactggca cttcaggaac aagcgggcgc 
cggagaatca tacgcattcg gtgccgagag 
ggaatgcccg cagcttcagg caggcgctgc 
ccggcacgcg accgggcgca ccgcagatgg 
gcgaggcggg tttttcggcc ggggacgccg 
ctgttggggc cgtgcttgag gagcaggccg 
ccgttgaaca ggctccgctc tcgccgctgt 
ccggtccgga cgcagcgttc gagcagggac 
ggaggctcgt tgtcaggaac gttgaaggac 
tgccggagcg caacccactc actacagcag 
ccaccgcgtc agacgcccgt agcagcccgc 
ccaagcctca cggccgcgct cggcctctct 
gctcactgac tcgctgcgct cggtcgttcg 
ggcggtaata cggttatcca cagaatcagg 



attggccgcc 
accaacgcat 
agatcgcgca 
gcgacagtgc 
agcctccgct 
ttatgtttat 
gtgccgccct 
cggaacggtt 
tgctcgacgc 
ccgacgacga 
tcgcctaccg 
aaacggccga 
tcaatgcgct 
gcgacagcga 
tgcgggccgc 
tcgcggtgat 
cgagaaaggg 
agccatgtag 
tacgggcttt 
srgcggccttc 
gctgcggcga 
ggataacgca 



gcccgaaacg 
acagcgccag 
ggaggcccgg 
tcagaattac 
ggtccgattg 
cagtgataaa 
ggacctgttg 
gggggttcag 

actggccgaa 
ctggcgctca 
cgatggcgcg 
cgcgcagctt 
gatgacaatc 
tgccggcgag 
gatagacgcc 
tgtcgatgga 
tgacgattga 
acaacatccc 
ttcatgccct 
tggcgctctt 
gcggtatcag 
ggaaagaaca 



atccgacagc 
cagaatgcca 
cagcaccggc 
gatcaggggt 
aacgcgcgga 
gtgtcaagca 
aacgaggtcg 
cagccggcgc 
gccatgctgg 
tttctgatcg 
cgcatccatg 
cgcttcctct 
agctacttca 
cgcggcggca 
ttcgacgaag 
ttggcgaaaa 
tcaggaccgc 
ctcccccttt 
gccctagcgt 
ccgcttcctc 
ctcactcaaa 
tgtgagcaaa 



5220 
5280 
5340 
5400 
5410 



60 
120 
180 
240 
300 
360 
42 0 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 



BASF Plant Science GmbH 20030015 PF 54305 DE 

56 

aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 1380 

ccgcccccct gacgagcatc'acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 1440 

aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 1500 

gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttt 1560 

ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat ccatcctttt 162 0 

tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg tgtatccaac 1680 

ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt tccttcttca 1740 

ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga ggctggccgg 1800 

ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag ccaaccagga 1860 

agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg attgaggaaa 1920 

aggcggcggc ggccggcatg agcotgtcgg cctacctgct ggccgtcggc cagggctaca 1980 

aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc aatggcgacc 2040 

tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc acggcgcggt 2100 

tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag gacgagcttg 2160 

gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt tagccgctaa 222 0 

aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat caagaagagc 2280 

gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga gcgcctttgc 2340 

gacgctcacc gggctggttg ccctcgccgc tgggctggcg gccgtctatg gccctgcaaa 2400 

cgcgccagaa acgccgtcga agccgtgtgc gagacaccgc ggccgccggc gttgtggata 2460 

cctcgcggaa aacttggccc tcactgacag atgaggggcg gacgttgaca cttgaggggc 2520 

cgactcaccc ggcgcggcgt tgacagatga ggggcaggct cgatttcggc cggcgacgtg 2580 

gagctggcca gcctcgcaaa tcggcgaaaa cgcctgattt tacgcgagtt tcccacagat 2640 

gatgtggaca agcctgggga taagtgccct gcggtattga cacttgaggg gcgcgactac 2700 

tgacagatga ggggcgcgat ccttgacact tgaggggcag agtgctgaca gatgaggggc 2760 

gcacctattg acatttgagg ggctgtccac aggcagaaaa tccagcattt gcaagggttt 2820 

ccgcccgttt ttcggccacc gctaacctgt cttttaacct gcttttaaac caatatttat 2880 

aaaccttgtt tttaaccagg gctgcgccct gtgcgcgtga ccgcgcacgc cgaagggggg 2940 

tgccccccct tctcgaaccc tcccggcccg ctaacgcggg cctcccatcc ccccaggggc 3000 

tgcgcccctc ggccgcgaac ggcctcaccc caaaaatggc agcgctggca gtccttgcca 3 060 

ttgccgggat cggggcagta acgggatggg cgatcagccc gagcgcgacg cccggaagca. 3120 

ttgacgtgcc gcaggtgctg gcatcgacat tcagcgacca ggtgccgggc agtgagggcg 3180 
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gcggcctggg tggcggcctg cccttcactt cggccgtcgg ggcattcacg gacttcatgg 
cggggccggc aatttttacc ttgggcattc ttggcatagt ggtcgcgggt gccgtgctcg 
tgttcggggg tgcgataaac ccagcgaacc atttgaggtg ataggtaaga ttataccgag 
gtatgaaaac gagaattgga cctttacaga attactctat gaagcgccat atttaaaaag 
ctaccaagac gaagaggatg aagaggatga ggaggcagat tgccttgaat atattgacaa 
tactgataag ataatatatc ttttatatag aagatatcgc cgtatgtaag gatttcaggg 
ggcaaggcat aggcagcgcg cttatcaata tatctataga atgggcaaag cataaaaact 
tgcatggact aatgcttgaa acccaggaca ataaccttat agcttgtaaa ttctatcata 
attgggtaat gactccaact tattgatagt gttttatgtt cagataatgc ccgatgactt 
tgtcatgcag ctccaccgat tttgagaacg acagcgactt ccgtcccagc cgtgccaggt 
gctgcctcag attcaggtta tgccgctcaa ttcgctgcgt atatcgcttg ctgattacgt 
gcagctttcc cttcaggcgg gattcataca gcggccagcc atccgtcatc catatcacca 
cgtcaaaggg tgacagcagg ctcataagac gccccagcgt cgccatagtg cgttcaccga 
atacgtgcgc aacaaccgtc ttccggagac tgtcatacgc gtaaaacagc cagcgctggc 
gcgatttagc cccgacatag ccccactgtt cgtccatttc cgcgcagacg atgacgtcac 
tgcccggctg tatgcgcgag gttaccgact gcggcctgag ttttttaagt gacgtaaaat 
cgtgttgagg ccaacgccca taatgcgggc tgttgcccgg catccaacgc cattcatggc 
catatcaatg attttctggt gcgtaccggg ttgagaagcg gtgtaagtga actgcagttg 
ccatgtttta cggcagtgag agcagagata gcgctgatgt ccggcggtgc ttttgccgtt 
acgcaccacc ccgtcagtag ctgaacagga gggacagctg atagacacag aagccactgg 
agcacctcaa aaacaccatc atacactaaa tcagtaagtt ggcagcatca cccataattg 
tggtttcaaa atcggctccg tcgatactat gttatacgcc aactttgaaa acaactttga 
aaaagctgtt ttctggtatt taaggtttta gaatgcaagg aacagtgaat tggagttcgt 
cttgttataa ttagcttctt ggggtatctt taaatactgt agaaaagagg aaggaaataa 
taaatggcta aaatgagaat atcaccggaa ttgaaaaaac tgatcgaaaa ataccgctgc 
gtaaaagata cggaaggaat gtctcctgct aaggtatata agctggtggg agaaaatgaa 
aacctatatt taaaaatgac ggacagccgg tataaaggga ccacctatga tgtggaacgg 
gaaaaggaca tgatgctatg gctggaagga aagctgcctg ttccaaaggt cctgcacttt 
gaacggcatg atggctggag caatctgctc atgagtgagg ccgatggcgt cctttgctcg 
gaagagtatg aagatgaaca aagccctgaa aagattatcg agctgtatgc ggagtgcatc 
aggctctttc actccatcga catatcggat tgtccctata cgaatagctt agacagccgc 
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ttagccgaat tggattactt actgaataac gatctggccg atgtggattg cgaaaactgg 5100 

gaagaagaca ctccatttaa agatccgcgc gagctgtatg attttttaaa gacggaaaag 5160 

cccgaagagg aacttgtctt ttcccacggc gacctgggag acagcaacat ctttgtgaaa 5220 

gatggcaaag taagtggctt tattgatctt gggagaagcg gcagggcgga caagtggtat 5280 

gacattgcct tctgcgtccg gtcgatcagg gaggatatcg gggaagaaca gtatgtcgag 5340 

ctattttttg acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta 5400 

ctggatgaat tgttttagta cctagatgtg gcgcaacgat gccggcgaca agcaggagcg 5460 

caccgacttc ttccgcatca agtgttttgg ctctcaggcc gaggcccacg gcaagtattt 5520 

gggcaagggg tcgctggtat tcgtgcaggg caagattcgg aataccaagt acgagaagga 5580 

cggccagacg gtctacggga ccgacttcat tgccgataag gtggattatc tggacaccaa 5640 

ggcaccaggc gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat 570 0 

cccgcaagga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat 5760 

cgacgcgggg ttttccgccg aggatgccga aaccatcgca agccgcaccg tcatgcgtgc 5820 

gccccgcgaa accttccagt ccgtcggctc gatggtccag caagctacgg ccaagatcga 5880 

gcgcgacagc gtgcaactgg ctccccctgc cctgcccgcg ccatcggccg ccgtggagcg 5940 

ttcgcgtcgt ctcgaacagg aggcggcagg tttggcgaag tcgatgacca tcgacacgcg 6000 

aggaactatg acgaccaaga agcgaaaaac cgccggcgag gacctggcaa aacaggtcag 606 0 

cgaggccaag caggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaatgcagct 612 0 

ttccttgttc gatattgcgc cgtggccgga cacgatgcga gcgatgccaa acgacacggc 6180 

ccgctctgcc ctgttcacca cgcgcaacaa gaaaatcccg cgcgaggcgc tgcaaaacaa 6240 

ggtcattttc cacgtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc 6300 

cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360 

cgagccgatc accttcacgt tctacgagct ttgccaggac ctgggctggt cgatcaatgg 6420 

ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt 6480 

cacgtccgac cgcgttgggc acctggaatc ggtgtcgctg ctgcaccgct tccgcgtcct 6540 

ggaccgtggc aagaaaacgt cccgttgcca ggtcctgatc gacgaggaaa tcgtcgtgct 6600 

gtttgctggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac 6660 

ggcccgacgg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga 6720 

aaccttccgc ctcatgtgcg gatcggattc cacccgcgtg aagaagtggc gcgagcaggt 6780 

cggcgaagcc tgcgaagagt tgcgaggcag cggcptggtg gaacacgcct gggtcaatga 6840 

tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 6900 
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agccagcgct 
tcagtatcgc 
ttgacaattg 
cgcgagatcc 
cacgaggaga 
ggcgcctaca 
aaggacgctc 

ggggtcgccg 

cgacagattc 
tcgctattct 
acggtaggcg 
ccgatacgat 
gtgttgacac 
gtttccatgg 
acctttaccg 
tttgatccgc 
ctgatcggag 
acagttgttt 
catcaggccg 
aggggagttg 
cggctttatc 
cggttaagcg 
tttgatcaca 
tcatccgtgt 
gagcaaagtc 
gcctgtatcg 
tggcaggata 
gacgttttta 
tgcccttcac 
gcaggcgaaa 
agaatagccc 



ttactggcat 
tcgggacgca 
tgattaaggc 
gattgtcggc 
aaaagcccat 
tcgacggcga 
acaaggcgca 
gtatgctgct 
caacgggaat 
ggagcttgtt 
ctgtgcagcc 
tgatggcggt 
caaacgcagc 
cgttcggaac 
cctggcaact 
caatcccgat 
cgggtttaac 
ccttactggg 
acagtcggaa 
atatcgtcaa 
cagcgatttc 
agaaatgaat 
ggcagcaacg 
ttcaaacccg 
tgccgcctta 
agtggtgatt 
tattgtggtg 
atgtactggg 
cgcctggccc 
atcctgtttg 
gagatagggt 



ttcaggaaca 
cggcgcgctc 
tcagattcga 
cctgaagaaa 
ggaggcgttc 
gatcattggg 
tctgtccggc 
gcgggcgttg 
ctggtggatg 
gtttatttcg 
gctgatggtc 
cctgggggct 
gctagatcct 
cgtgctgacc 
ggcggccgga 
gcctacagga 
ctacttcctt 
ctttctcagc 
cttcgggtcc 
cgttcacttc 
ctattatgtc 
aagaaggctg 
ctctgtcatc 
gcagcttagt 
caacggctct 
ttgtgccgag 
taaacaaatt 
gtggtttttc 
tgagagagtt 
atggtggttc 
tgagtgttgt 



agcgggcact gctcgacgca 
tacgaactgc cgataaacag 
cggcttggag cggccgacgt 
gctccagaga tgttcgggtc 
gctgaacggt tgcgagatgc 
ctgtcggtct tcaaacagga 
gttttcgtgg agcccgaaca 
ccggcgggtt tattgctcgt 
cgcatcttca tcctcggcgc 
gtctaccgcc tgccgggcgg 
gtgttcatct ctgccgctct 
atttgcggaa ctgcgggcgt 
gtcggcgtcg cagcgggcct 
cgcaagtggc aacctcccgt 
ggacttctgc tcgttccagt 
accaatgttc tcggcctggc 
tggttccggg ggatctcgcg 
cccagatctg gggtcgatca 
ccgacctgta ccattcggtg 
taaagaaata gcgccactca 
ggcatagttc tcaagatcga 
ataattcgga tctctgcgag 
gttacaatca acatgctacc 
tgccgttctt ccgaatagca 
cccgctgacg ccgtcccgga 
ctgccggtcg gggagctgtt 
gacgcttaga caacttaata 
ttttcaccag tgagacgggc 
gcagcaagcg gtccacgctg 
cgaaatcggc aaaatccctt 
tccagtttgg aacaagagtc 



PF 54305 DE 

cttgcttcgc 6960 

aggattaaaa 702 0 

gcaggatttc 7080 

cgtttacgag 7140 

cgtggcattc 7200 

ggacggcccc 7260 

gcgaggccga 7320 

gatgatcgtc 7380 

acttaatatt 7440 

ggtcgcggcg 7500 

gctaggtagc 7560 

ggcgctgttg 7620 

ggcgggggcg 7680 

gcctctgctc 7740 

agctttagtg 7800 

gtggctcggc 7860 

actcgaacct 7 92 0 

gccggggatg 7980 

agcaatggat 804 0 

gcttcctcag 8100 

cagcctgtca 8160 

ggagatgata 822 0 

ctccgcgaga 8280 

tcggtaacat 8340 

ctgatgggct 8400 

ggctggctgg 8460 

acacattgcg 8520 

aacagctgat 8580 

gtttgcccca 8640 

ataaatcaaa 8700 

cactattaaa 8760 
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gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 8820 

tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 

ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 

ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcaactgt tgggaagggc 9000 

gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060. 

gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 

aattaattcc catcttgaaa gaaatatagt ttaaatattt attgataaaa taacaagtca 9180 

ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagaaatatt 9240 

tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 9300 

tgtgtaatac ataaattgat gatatagcta gcttagctca tcgggggatc cgtcgaagct 9360 

agcttgggtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat gcgctgcgaa 9420 

tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct 9480 

tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 

ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 

tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9660 

agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 

gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 

gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 

gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 

tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 

agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 

ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 

ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 

cctgcgtgca atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 10200 

tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 

agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 

acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 

tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 

gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 

gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 

cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 
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gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttcccttgtc cagatagccc agtagctgac attoatccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgcggca 10800 
gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 11220 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 
tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
agccagccca ccgcggtggg cggccgcctg cagtctagaa ggcctcctgc tttaatgaga 11580 
tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 11640 
aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 11700 
atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtcc 11760 
gtcgacgaat tcgagctcgg cgcgcctcta gaggatcgat gaattcagat cggctgagtg 11820 
gctccttcaa cgttgcggtt ctgtcagttc caaacgtaaa acggcttgtc ccgcgtcatc 11880 
ggcgggggtc ataacgtgac tcccttaatt ctccgctcat gatcagattg tcgtttcccg 1194 o 
ccttcagttt aaactatcag tgtttgacag gatatattgg cgggtaaacc taagagaaaa 12000 
gagcgtttat tagaataatc ggatatttaa aagggcgtga aaaggtttat ccttcgtcca 12060 
tttgtatgtg catgccaacc acagggttcc cca 12093 

<210> 28 

<211> 12085 

<212> DNA 

<213> artificial sequence • 
<220> 

<221> misc_feature 

<223> 2iSS^^ Mi0aW * t0r e±ner ^otor-Ternunator-E^ 
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<400> 28 
gatctggcgc 



gcgcccagca 
tagtgggcgg 
ataatcaggc 
atgttgggtt 
ttctttatca 
tgacaaagtt 
gcgtagacgg 
tttactggca 
cggagaatca 
ggaatgcccg 
ccggcacgcg 
gcgaggcggg 
ctgttggggc 
ccgttgaaca 
ccggtccgga 
ggaggctcgt 
tgccggagcg 
ccaccgcgtc 
ccaagcctca 
gctcactgac 
ggcggtaata 
aggccagcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
ccgctgcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
ctaccgccgg 



cggccagcga 
caggtgcgca 
tgacgtcgtt 
cgatgccgac 
tcacgtctgg 
ctgataagtt 
gcagccgaat 
tctgacgaca 
cttcaggaac 
tacgcattcg 
cagcttcagg 
accgggcgca 
tttttcggcc 
cgtgcttgag 
ggctccgctc 
cgcagcgttc 
tgtcaggaac 
caacccactc 
agacgcccgt 
cggccgcgct 
tcgctgcgct 
cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 



gacgagcaag 
ggcaaattgc 
cgagtgaacc 
agcgtcgagc 
cctccggacc 
ggtggacata 
acagtgatcc 
cgcaaactgg 
aagcgggcgc 
gtgccgagag 
caggcgctgc 
ccgcagatgg 
ggggacgccg 
gagcaggccg 
tcgccgctgt 
gagcagggac 
gttgaaggac 
actacagcag 
agcagcccgc 
cggcctctct 
cggtcgttcg 
cagaatcagg 
accgtaaaaa 
acaaaaatcg 
cgtttccccc 
acctgtccgc 

ggggtcatta 

tgccaaaggg 
ggtgaagtag 
gcggtgctca 
gagggcaagc 



attggccgcc 
accaacgcat 
agatcgcgca 
gcgacagtgc 
agcctccgct 
ttatgtttat 
gtgccgccct 
cggaacggtt 
tgctcgacgc 
ccgacgacga 
tcgcctaccg 
aaacggccga 
tcaatgcgct 
gcgacagcga 
tgcgggccgc 
tcgcggtgat 
cgagaaaggg 
agccatgtag 
tacgggcttt 
ggcggccttc 
gctgcggcga 
ggataacgca 
ggccgcgttg 
acgctcaagt 
tggaagctcc 
ctttctccct 
tagcgatttt 
ttcgtgtaga 
gcccacccgc 
acgggaatcc 
ggatggctga 



gcccgaaacg 
acagcgccag 
ggaggcccgg 
tcagaattac 
ggtccgattg 
cagtgataaa 
ggacctgttg 

gggggttcag 

actggccgaa 
ctggcgctca 
cgatggcgcg 
cgcgcagctt 
gatgacaatc 
tgccggcgag 
gatagacgcc 
tgtcgatgga 
tgacgattga 
acaacatccc 
ttcatgccct 
tggcgctctt 
gcggtatcag 
ggaaagaaca 
ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 



atccgacagc 
cagaatgcca 
cagcaccggc 
gatcaggggt 
aacgcgcgga 
gtgtcaagca 
aacgaggtcg 
cagccggcgc 
gccatgctgg 
tttctgatcg 
cgcatccatg 
cgcttcctct 
agctacttca 
cgcggcggca 
ttcgacgaag 
ttggcgaaaa 
tcaggaccgc 
ctcccccttt 
gccctagcgt 
ccgcttcctc 
ctcactcaaa 
tgtgagcaaa 
tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttt 
ccatcctttt 
tgtatccaac 
tccttcttca 
ggctggccgg 
ccaaccagga 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
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agggcagccc 
aggcggcggc 
aaatcacggg 
tgggccgcct 
tcggtgatgc 
gcaaggtcat 
aacggccggg 
gacttcgcgg 
gacgctcacc 
cgcgccagaa 
cctcgcggaa 
cgactcaccc 
gagctggcca 
gatgtggaca 
tgacagatga 
gcacctattg 
ccgcccgttt 
aaaccttgtt 
tgccccccct 
tgcgcccctc 
ttgccgggat 
ttgacgtgcc 
gcggcctggg 
cggggccggc 
tgttcggggg 
gtatgaaaac 
ctaccaagac 
tactgataag 
ggcaaggcat 
tgcatggact 
attgggtaat 



acctatcaag 
ggccggcatg 
cgtcgtggac 
gggcggcctg 
cacgatcctc 
gatgggcgtg 
gggtgcgcgt 
agctggtgaa 

gggctggttg 

acgccgtcga 
aacttggccc 
ggcgcggcgt 
gcctcgcaaa 
agcctgggga 
ggggcgcgat 
acatttgagg 
ttcggccacc 
tttaaccagg 
tctcgaaccc 
ggccgcgaac 
cggggcagta 
gcaggtgctg 
tggcggcctg 
aatttttacc 
tgcgataaac 
gagaattgga 
gaagaggatg 
ataatatatc 
aggcagcgcg 
aatgcttgaa 
gactccaact 



gtgtactgcc 
agcctgtcgg 
tatgagcacg 
ctgaaactct 
gccctgctgg 
gtccgcccga 
gattgccaag 
gtacatcacc 
ccctcgccgc 
agccgtgtgc 
tcactgacag 
tgacagatga 
tcggcgaaaa 
taagtgccct 
ccttgacact 
ggctgtccac 
gctaacctgt 
gctgcgccct 
tcccggcccg 
ggcctcaccc 
acgggatggg 
gcatcgacat 
cccttcactt 
ttgggcattc 
ccagcgaacc 
cctttacaga 
aagaggatga 
ttttatatag 
cttatcaata 
acccaggaca 
tattgatagt 



ttccagacga 
cctacctgct 
tccgcgagct 
ggctcaccga 
cgaagatcga 
gggcagagcc 
cacgtcccca 
gacgagcaag 
tgggctggcg 
gagacaccgc 
atgaggggcg 
ggggcaggct 
cgcctgattt 
gcggtattga 
tgaggggcag 
aggcagaaaa 
cttttaacct 
gtgcgcgtga 
ctaacgcggg 
caaaaatggc 
cgatcagccc 
tcagcgacca 
cggccgtcgg 
ttggcatagt 
atttgaggtg 
attactctat 
ggaggcagat 
aagatatcgc 
tatctataga 
ataaccttat 
gttttatgtt 



acgaagagcg 
ggccgtcggc 
ggcccgcatc 
cgacccgcgc 
agagaagcag 
atgacttttt 
tgcgctccat 
gcaagaccga 
gccgtctatg 
ggccgccggc 
gacgttgaca 
cgatttcggc 
tacgcgagtt 
cacttgaggg 
agtgctgaca 
tccagcattt 
gcttttaaac 
ccgcgcacgc 
cctcccatcc 
agcgctggca 
gagcgcgacg 
ggtgccgggc 
ggcattcacg 
ggtcgcgggt 
ataggtaaga 
gaagcgccat 
tgccttgaat 
cgtatgtaag 
atgggcaaag 
agcttgtaaa 
cagataatgc 



attgaggaaa 
cagggctaca 
aatggcgacc 
acggcgcggt 
gacgagcttg 
tagccgctaa 
caagaagagc 
gcgcctttgc 
gccctgcaaa 
gttgtggata 
cttgaggggc 
cggcgacgtg 
tcccacagat 
gcgcgactac 
gatgaggggc 
gcaagggttt 
caatatttat 
cgaagggggg 
ccccaggggc 
gtccttgcca 
cccggaagca 
agtgagggcg 
gacttcatgg 
gccgtgctcg 
ttataccgag 
atttaaaaag 
atattgacaa 
gatttcaggg 
cataaaaact 
ttctatcata 
ccgatgactt 



1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 
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tgtcatgcag 
gctgcctcag 
gcagctttcc 
cgtcaaaggg 
atacgtgcgc 
gcgatttagc 
tgcccggctg 
cgtgttgagg 
catatcaatg 
ccatgtttta 
acgcaccacc 
agcacctcaa 
tggtttcaaa 
aaaagctgtt 
cttgttataa 
taaatggcta 
gtaaaagata 
aacctatatt 
gaaaaggaca 
gaacggcatg 
gaagagtatg 
aggctctttc 
ttagccgaat 
gaagaagaca 
cccgaagagg 
gatggcaaag 
gacattgcct 
ctattttttg 
ctggatgaat 
caccgacttc 
gggcaagggg 



ctccaccgat 
attcaggtta 
cttcaggcgg 
tgacagcagg 
aacaaccgtc 
cccgacatag 
tatgcgcgag 
ccaacgccca 
attttctggt 
cggcagtgag 
ccgtcagtag 
aaacaccatc 
atcggctccg 
ttctggtatt 
ttagcttctt 
aaatgagaat 
cggaaggaat 
taaaaatgac 
tgatgctatg 
atggctggag 
aagatgaaca 
actccatcga 
tggattactt 
ctccatttaa 
aacttgtctt 
taagtggctt 
tctgcgtccg 
acttactggg 
tgttttagta 
ttccgcatca 
tcgctggtat 



tttgagaacg 
tgccgctcaa 
gattcataca 
ctcataagac 
ttccggagac 
ccccactgtt 
gttaccgact 
taatgcgggc 
gcgtaccggg 
agcagagata 
ctgaacagga 
atacactaaa 
tcgatactat 
taaggtttta 

ggggtatctt 

atcaccggaa 
gtctcctgct 
ggacagccgg 
gctggaagga 
caatctgctc 
aagccctgaa 
catatcggat 
actgaataac 
agatccgcgc 
ttcccacggc 
tattgatctt 
gtcgatcagg 
gatcaagcct 
cctagatgtg 
agtgttttgg 
tcgtgcaggg 



acagcgactt 
ttcgctgcgt 
gcggccagcc 
gccccagcgt 
tgtcatacgc 
cgtccatttc 
gcggcctgag 
tgttgcccgg 
ttgagaagcg 
gcgctgatgt 
gggacagctg 
tcagtaagtt 
gttatacgcc 
gaatgcaagg 
taaatactgt 
ttgaaaaaac 
aaggtatata 
tataaaggga 
aagctgcctg 
atgagtgagg 
aagattatcg 
tgtccctata 
gatctggccg 
gagctgtatg 
gacctgggag 
gggagaagcg 
gaggatatcg 
gattgggaga 
gcgcaacgat 
ctctcaggcc 
caagattcgg 



ccgtcccagc 
atatcgcttg 
atccgtcatc 
cgccatagtg 
gtaaaacagc 
cgcgcagacg 
ttttttaagt 
catccaacgc 
gtgtaagtga 
ccggcggtgc 
atagacacag 
ggcagcatca 
aactttgaaa 
aacagtgaat 
agaaaagagg 
tgatcgaaaa 
agctggtggg 
ccacctatga 
ttccaaaggt 
ccgatggcgt 
agctgtatgc 
cgaatagctt 
atgtggattg 
attttttaaa 
acagcaacat 
gcagggcgga 
gggaagaaca 
aaataaaata 
gccggcgaca 
gaggcccacg 
aataccaagt 



cgtgccaggt 
ctgattacgt 
catatcacca 
cgttcaccga 
cagcgctggc 
atgacgtcac 
gacgtaaaat 
cattcatggc 
actgcagttg 
ttttgccgtt 
aagccactgg 
cccataattg 
acaactttga 
tggagttcgt 
aaggaaataa 
ataccgctgc 
agaaaatgaa 
tgtggaacgg 
cctgcacttt 
cctttgctcg 
ggagtgcatc 
agacagccgc 
cgaaaactgg 
gacggaaaag 
ctttgtgaaa 
caagtggtat 
gtatgtcgag 
ttatatttta 
agcaggagcg 
gcaagtattt 
acgagaagga 



3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 



10 



20 
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cggccagacg gtctacggga ccgacttcat tgccgataag gtggattatc tggacaccaa 5640 

ggcaccaggc gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat 5700 

cccgcaagga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat 5760 

cgacgcgggg ttttccgccg aggatgccga aaccatcgca agccgcaccg tcatgcgtgc 582 0 

gccccgcgaa accttccagt ccgtcggctc gatggtccag caagctacgg ccaagatcga 5880 

gcgcgacagc gtgcaactgg ctccccctgc cctgcccgcg ccatcggccg ccgtggagcg 5940 

ttcgcgtcgt ctcgaacagg aggcggcagg tttggcgaag tcgatgacca tcgacacgcg 600 0 

aggaactatg acgaccaaga agcgaaaaac cgccggcgag gacctggcaa aacaggtcag 6060 

cgaggccaag caggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaatgcagct 612 0 

ttccttgttc gatattgcgc cgtggccgga cacgatgcga gcgatgccaa' acgacacggc 6180 

ccgctctgcc ctgttcacca cgcgcaacaa gaaaatcccg cgcgaggcgc tgcaaaacaa 6240 

^ ggtcattttc cacgtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc 6300 

cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360 

cgagccgatc accttcacgt tctacgagct ttgccaggac ctgggctggt cgatcaatgg 642 0 

30 ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt 6480 

cacgtccgac cgcgttgggc' acctggaatc ggtgtcgctg ctgcaccgct tccgcgtcct 6540 

ggaccgtggc aagaaaacgt cccgttgcca ggtcctgatc gacgaggaaa tcgtogtgct 6600' 

gtttgotggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac 6660 

ggcccgacgg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga 672 0 

aaccttccgc ctcatgtgcg gatcggattc cacccgcgtg aagaagtggc gcgagcaggt 6780 

cggcgaagcc tgcgaagagt tgcgaggcag cggcctggtg gaacacgcct gggtcaatga 6840 

tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 690 0 

agccagcgct ttactggcat ttcaggaaca agcgggcact gctcgacgca cttgcttcgc 6960 

tcagtatcgc tcgggacgca cggcgcgctc tacgaactgc cgataaacag aggattaaaa 7020 

ttgacaattg tgattaaggc tcagattcga cggcttggag cggccgacgt gcaggatttc 7080 

cgcgagatcc gattgtcggc cctgaagaaa gctccagaga tgttcgggtc cgtttacgag 7140 

cacgaggaga aaaagcccat ggaggcgttc gctgaacggt tgcgagatgc cgtggcattc 7200 

ggcgcctaca tcgacggcga gatcattggg ctgtcggtct tcaaacagga ggacggcccc 7260 

aaggacgctc acaaggogca tctgtccggc gttttcgtgg agcccgaaca gcgaggccga 7320 

ggggtcgccg gtatgctgct gcgggcgttg ccggcgggtt tattgctcgt gatgatcgtc 7380 

cgacagattc caacgggaat ctggtggatg cgcatcttca tcctcggcgc acttaatatt 7440 
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tcgctattct 
acggtaggcg 
ccgatacgat 
gtgttgacac 
gtttccatgg 
acctttaccg 
tttgatccgc 
ctgatcggag 
acagttgttt 
catcaggccg 
aggggagttg 
cggctttatc 
cggttaagcg 
tttgatcaca 
tcatccgtgt 
gagcaaagtc 
• gcctgtatcg 
tggcaggata 
gacgttttta 
tgcccttcac 
gcaggcgaaa 
agaatagccc 
gaacgtggac 
tgaaccatca 
ccctaaaggg 
ggaagggaag 
gatcggtgcg 
gattaagttg 
aattaattcc 
ggtattatag 
tcaataactg 



ggagcttgtt 
ctgtgcagcc 
tgatggcggt 
caaacgcagc 
cgttcggaac 
cctggcaact 
caatcccgat 
cgggtttaac 
ccttactggg 
acagtcggaa 
atatcgtcaa 
cagcgatttc 
agaaatgaat 
ggcagcaacg 
.ttcaaacccg 
tgccgcctta 
agtggtgatt 
tattgtggtg 
atgtactggg 
cgcctggccc 
atcctgtttg 
gagatagggt 
tccaacgtca 
cccaaatcaa 
agcccccgat 
aaagcgaaag 
ggcctcttcg 
ggtaacgcca 
catcttgaaa 
tccaagcaaa 
attatatcag 



gtttatttcg 
gctgatggtc 

CCtgggggct 

gctagatcct 
cgtgctgacc 
srsrcggccgga 
gcctacagga 
ctacttcctt 
ctttctcagc 
cttcgggtcc 
cgttcacttc 
ctattatgtc 
aagaaggctg 
ctctgtcatc 
gcagcttagt 
caacggctct 
ttgtgccgag 
taaacaaatt 
gtggtttttc 
tgagagagtt 
atggtggttc 
tgagtgttgt 
aagggcgaaa 
gttttttggg 
ttagagcttg 
gagcgggcgc 
ctattacgcc 
gggttttccc 
gaaatatagt 
aacataaatt 
ctggtacatt 



gtctaccgcc 
gtgttcatct 
atttgcggaa 
gtcggcgtcg 
.cgcaagtggc 
ggacttctgc 
accaatgttc 
tggttccggg 
cccagatctg 
ccgacctgta 
taaagaaata 
ggcatagttc 
ataattcgga 
gttacaatca 
tgccgttctt 
cccgctgacg 
ctgccggtcg 
gacgcttaga 
ttttcaccag 
gcagcaagcg 
cgaaatcggc 
tccagtttgg 
aaccgtctat 
gtcgaggtgc 
acggggaaag 
cattcaggct 
agctggcgaa 
agtcacgacg 
ttaaatattt 
tattgatgca 
gccgtagatg 



tgccgggcgg 
ctgccgctct 
ctgcgggcgt 
cagcgggcct 
aacctcccgt 
tcgttccagt 
tcggcctggc 
ggatctcgcg 
gggtcgatca 
ccattcggtg 
gcgccactca 
tcaagatcga 
tctctgcgag 
acatgctacc 
ccgaatagca 
ccgtcccgga 

srggagctgtt 

caacttaata 
tgagacgggc 
gtccacgctg 
aaaatccctt 
aacaagagtc 
cagggcgatg 
cgtaaagcac 
ccggcgaacg 
gcgcaactgt 
agggggatgt 
ttgtaaaacg 
attgataaaa 
agtttaaatt 
aaagactgag 



ggtcgcggcg 
gctaggtagc 
ggcgctgttg 
ggcgggggcg 
gcctctgctc 
agctttagtg 
gtggctcggc 
actcgaacct 
gccggggatg 
agcaatggat 
gcttcctcag 
cagcctgtca 
ggagatgata 
ctccgcgaga 
tcggtaacat 
ctgatgggct 
ggctggctgg 
acacattgcg 
aacagctgat 
gtttgcccca 
ataaatcaaa 
cactattaaa 
gcccactacg 
taaatcggaa 
tggcgagaaa 
tgggaagggc 
gctgcaaggc 
acggccagtg 
taacaagtca 
cagaaatatt 
tgcgatatta 



7500 
7560 
7620 
7680 
7740 
7800 
7860 
7920 
7980 
8040 
8100 
8160 
8220 
8280 
8340 
8400 
8460 
8520 
8580 
"8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
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t gtg taatac ataaatt g at g ata t a g cta g ctta g ctca tc gggggatc cgtcg aa g ct 936C 
5 a gCttggg tc cc g ctca g aa g aactc g tca a g aa ggcg at a g aa ggcg at g c g ct gcg aa 942C 
tc gggag c gg c g atacc gta aa g cac g a gg aa gcgg tca g cccattc g cc g cca ag ctct 9480 
tca g caatat cac ggg ta g c caac g ctat g tcct g ata g c g.tccgccac acccagcogg 9540 
10 ccaca gtCg a t g aatcca ga aaa gcgg cca ttttccacca t g atat t c gg caa g ca gg ca 9600 
tc g ccat ggg tcac g ac gag atcc tcg cc g to gggcatg c gcgccttgag cctggcgaac 9660 
15 a g ttc ggctg gcgcgagccc ct g at g ctct tc g tc=a g at ca t cct g atc gacaagaccg 9720 
.cttccatcc g a gt a Cgtgc tc g ctc gatg c g at g tttc g ct tggtggtc gaatgggcag 9780 
gt a gCCgg at caa gcg tat g cagccgccgc att g catca g ccat gatgga tactttctcg 9840 
20 9 =aggagcaa gg t gag at g a caggagatcc tgccccggca cttc g cccaa ta g ca g cc ag 9900 
tcccttccc g cttca gtg ac aacgtcgagc aca g ct g c g c aaggaacgcc c gt c gtggcc 9960 
25 a gC cac g ata g cc g c g ct gc ctcgtcctgc a gtt cattca ggg cacc gga caggtcggtc 10020 
ttgacaaaaa g aacc gggcg c=cct g c g ct gacagccgga acac ggcggc atcagagcag 10080 
cc g at tgt ct gt t gtg ccca gtcatagccg aata g =c t ct ccacccaagc ggccggagaa 10140 
CCtg<=9tgCa atCCatctt ^ ttcaatccaa g ctcccat gg g ccctc g act a g a gt c gaga 10200 
tct gg att ga g a gtg aa t at .agactctaa tt gg atacc g a gggga attt at ggaacg tc 10260 
35 a g t ggag cat ttttg acaa g aaatatttgc ta gctg ata g t g acc ttagg cgacttttga 10320 
ac gcg caata at ggttt ct g acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
t g a gtgg ctc cttcaacgtt gcgg t t ct g t ca g ttccaaa c g taaaac gg ctt g tccc g c 10440 
gt catc ggcg ggggt ca t aa cgtgactccc ttaattctcc g ctcat g atc tt g atcccc t l 0500 
g c g ccatca g atcctt ggcg gcaagaaagc catcca g ttt acttt g ca gg gcttcccaac 10560 
. cttacca g a g ggcg cccca g ctggcaattc c gg ttc g ctt g ct gt ccata aaaccgccca 10620 
Stctasrctat cgccatgtaa .cccactgca a g ctacct g c tttotctttg c g ctt gcgtt 10680 
ttccettgte ca g ata g ccc agtagctgac at t catcc gg ggtcagcacc gtttCtg c gg 10740 
actggctttc t ac gtg ttcc gottecttt. g ca g ccctt g cgccctgag t g ctt gcgg ca 10800 
acgtgaagct tg cat g cct g caggtcgacg gcgcgccgag ct=ctc gag c aaatttacac 10860 
att g ccacta aac g tctaaa ccctt g taat ttgtttttgt tttactat gt gtgtftgf 10920 
t ttg attt g c gataaatttt: tatattt gg t actaaattta taacaccttt tat g ctaac g 10980 
tttgccaaca cttagcaatt tgcaagttga ttaatt g att ctaaattatt tttgtettet 11040 
aaataca ta t a c taa tcaac t gg aaat gta aatatttgct aatatttcta ctataggaga 11100 
attaaa gtga gtg aatat gg taccacaagg tttggagatt taattgttgc aatgctgcat ^ 
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39 .t 39 c,ta tacaccaaa.; attoaataat tcctsaraat Mtaatmta ccscaMa3a ii2 ^ 
t« S a 33t3 c a^aac^a C3tggacaaa aggtttagta atttttc ^ ^ 
eaceac.cc aa^c^ 3t3cat3=at 3sat3ccctg tggaaa3ttt ^ 

tggaaatgat ttgcatggaa ocrshrr^ a 

ay a yccacgtgta aaaccatgac atccart-h^ . 

y ^tccacttgg aggatgcaat 11400 

actacaa.cc tacatgcaac tscastctat at>itaarea iii6o 

™. t , ctttcKtca t „ acaotca oa=3 . ttata atttcttoat ii52o 

tCCSatat=9 « ««— * 9 c« t .a t3 a Bat , t303S3 11580 

ac 3 ec t at 3 . tc3catgata tct3ctttoa gcacsttgta ^ 

CtCa '"° Ct C — 3 « — t 3aaE a t , t e.ccc 3 awo 

«— a« t «ac 3 . ataacattct =c3ttcaatt eeatcaa ^ ii7M 

93=3CgCCtC ta0a »"- «— «— — « 9 a 3 t33 «e=«c 11820 
a™ 33 ttct3tea3t t=c „ aaacggctta tccm 

tcat.ac.t, a«=cc«aa tccccc^c at 3 . t ca 3 ,c t3tc3tttco a ^ ct ^ ^ 

tt.a.ccatc a3t3ttt3ac a33atatatt 33e3OTtaaa cctaagaaaa aa ^ tt ^ 

attagaataa tcggatattt aaaaggcrcat CTa M *™4-.-4- 

agggcgt gaaaaggttt atccttcgtc catttgtatg 12060 

tgcatgccaa ccacagggtt cccca 




35 <210> 29 

<211> 12079 
<212> DNA. 

<213> artificial sequence 
40 <400> 29 

»tct 33 c 3 c c^cc.^a 3 ac 3 a 3 caa 3 att 33 ec 3 c= TOSmos accc 3 ac. 3 c 
3 c 3 =cca 3 ca ca 33t3 c 3 c, ^caaat^o accaa^ct ac. 3 c 3 cca 3 
ta 3t333 c 33 ^tctt c 3 , 3t3aac = a.acc^ca 33a33ccc33 ca3caccg30 
ata.tc, 33 e ctgco^ ^ ^aca^c tc. 3 aatt,c 3 at =a3333t 
at 3 t C333tt tcac 3 t= t33 cctcc^.cc a3 c=tcc 3 ct „« w t, aac^c^a 
"estate. ct 3 acaa 3tl : ttat3tttat cagt( , ataaa 

t 9 .caaa 3 tt »ca 3 c C3aat ac, 3t3 a t cc 3tg cc 3 ccct ^.cct^ aao 3a33t:c3 
tct 3aC3 a=a = 3 «a,ct 33 C33aac33tt ^ mtMg oa3cc3gC3c 
t« act33 ca ctcca^aac ^ t3ctcgiogc actggccgaa 3ccat3ct3g 
c^asaatc. tac 3 c a «= 3 ^cc^ =c 3 ac 3 ,c 3a c= 33 c 3 ctca t t tcc 3 , t c 3 
93 «ac 3 ccc 3 c.^ctca,*, ca 33 c 3 ct 3 c tcg cc t acc 3 3gat33c3C3 C3cacocatg 
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ccggcacgcg 
STcgaggcggg 
ctgttggggc 
ccgttgaaca 
ccggtccgga 
ggaggctcgt 
tgccggagcg 
ccaccgcgtc 
ccaagcctca 
gctcactgac 
ggcggtaata 
aggccagcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
ccgctgcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
ctaccgccgg 
agggcagccc 
aggcggcggc 
aaatcacggg 
tgggccgcct 
tcggtgatgc 
gcaaggtcat 
aacggccggg 
gacttcgcgg 
gacgctcacc 
cgcgccagaa 
cctcgcggaa 



accgggcgca 
tttttcggcc 
cgtgcttgag 
ggctccgctc 
cgcagcgttc 
tgtcaggaac 
caacccactc 
agacgcccgt 
cggccgcgct 
tcgctgcgct 
cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 
acctatcaag 
ggccggcatg 
cgtcgtggac 
gggcggcctg 
cacgatcctc 
gatgggcgtg 
gggtgcgcgt 
agctggtgaa 
gggctggttg 
acgccgtcga 
aacttggccc 



ccgcagatgg 
ggggacgccg 
gagcaggccg 
tcgccgctgt 
gagcagggac 
gttgaaggac 
actacagcag 
agcagcccgc 
cggcctctct 
cggtcgttcg 
cagaatcagg 
accgtaaaaa 
acaaaaatcg 
cgtttccccc 
acctgtccgc 
ggggtcatta 

tgccaaaggg 
ggtgaagtag 
gcggtgctca 
gagggcaagc 
gtgtactgcc 
agcctgtcgg 
tatgagcacg 
ctgaaactct 
gccctgctgg 
gtccgcccga 
gattgccaag 
gtacatcacc 
ccctcgccgc 
agccgtgtgc 
tcactgacag 



69 

aaacggccga 
tcaatgcgct 
gcgacagcga 
tgcgggccgc 
tcgcggtgat 
cgagaaaggg 
agccatgtag 
tacgggcttt 
ggcggccttc 
gctgcggcga 
ggataacgca 
ggccgcgttg 
acgctcaagt 
tggaagctcc 
ctttctccct 
tagcgatttt 
ttcgtgtaga 
gcccacccgc 
acgggaatcc 
ggatggctga 
ttccagacga 
cctacctgct 
tccgcgagct 
ggctcaccga 
cgaagatcga 
gggcagagcc 
cacgtcccca 
gacgagcaag 
tgggctggcg 
gagacaccgc 
atgaggggcg 



cgcgcagctt 
gatgacaatc 
tgccggcgag 
gatagacgcc 
tgtcgatgga 
tgacgattga 
acaacatccc 
ttcatgccct 
tggcgctctt 
gcggtatcag 
ggaaagaaca 
ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 
acgaagagcg 
ggccgtcggc 
ggcccgcatc 
cgacccgcgc 
agagaagcag 
atgacttttt 
tgcgctccat 
gcaagaccga 
gccgtctatg 
ggccgccggc 
gacgttgaca 



cgcttcctct 
agctacttca 
cgcggcggca 
ttcgacgaag 
ttggcgaaaa 
tcaggaccgc 
ctcccccttt 
gccctagcgt 
ccgcttcctc 
ctcactcaaa 
tgtgagcaaa 
tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttt 
ccatcctttt 
tgtatccaac 
tccttcttca 
ggctggccgg 
ccaaccagga 
attgaggaaa 
cagggctaca 
aatggcgacc 
acggcgcggt 
gacgagcttg 
tagccgctaa 
caagaagagc 
gcgcctttgc 
gccctgcaaa 
gttgtggata 
cttgaggggc 



720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 ' 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
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cactcaccc gg c gcggcgt tgacagatga ggggcaggct ^ 
gag ct ggc ca 3 cc tcgcaaa tcggcgaaaa cgcctgattt 264( 
,a tgtggaca agC c tgggga , aagtgccct gcggtafctga 

tg a=a g at g a ggggcgcgat ccttgacacfc tgaggggcag ^ 
1Q g cacct attg acatttgagg ggcfcgtccac gca ^ tt 

" ™~ gcttttaaac caatattfcat 288o 

a aacCttgtt tttaaccagg gctgcgccct ^ m 294Q 

t3CCCCCCCt **— ~- -ccatcc c=cc aggggc 30 00 

t.c.cccctc ggccgcgaac ggcctcaccc agcgctggca ^^^^ 3ogo 

2Q tt g cc gggat c ggggcagta ac gggatggg cga tca g ccc g a gcg c g ac g ccc gg aa gca 31 20 
tt gacgtg cc gcaggtgctg gcatcgacat tcagcgacca ggfcgccgggc agtga ^ g 3i8Q 

g c ggC ct ggg tggcggC ct g cccttc a ct t c gg cc gtCgg ggc a tt cac g ga =ttcat gg 
c ggggccgg c aatttttacc tt gggcatt c ttgg cata gt ggtcgcgggt gccgtgcfccg 
t gttCggggg tgcg ataaac cca gcg aacc attt gaggtg ata gg taa g a ttatacc gag 
g tat g aaaac g a g aatt gga cctttaca g a attactctat g a agcg ccat atttaaaaa g 
ctaccaa g ac g aa gagg at g aa gaggatga ggaggcagat tgccttgaat atattgacaa 
taCt5ataag ata — c ttttatat^g aa gatatcgc cgtatgtaag gatttcaggg 
^c aagg cat a ggC a gcg c g cttatcaata tatctata g a at gggcaaag cat.aaaact 
t g cat ggact aatg c ttg aa accc aggaca ataaC ctt at a gcttgtaaa ttctatcata 
att gggtaat gactccaact tattgatagt ^ tttatgtt cagafcaatgc ccgatgactfc 
t gtcatgcag ctccaccgat ttt gagaacg acagcgactt ccgtcccagc cgtgccaggt 
ontflceto^ at t ca gg tta tg c cg ctc aa ttcg ct g c gt atat c gcttg ct gattacgt 
gca gc tt t cc cttcaggcgg .attcataca gcgg cca g cc atcc g tc at c cat.tc.cc. 
c gtCaaaggg tgacagcagg ctcataagac gccccagcgt cgccatagtg cgtfccaccga 
at acgtg c g c aacaacc gt c tt=c ggag ac t gt catac gc g taaaac agc c agcg ct ggc 
ac ga ttt agc cc= g acata g ccccact gtt = g tccatt t c c gcg ca gacg atgacg tc ac 
t g ccc ggctg tatgcgcgag gtta cc ga c t gcgg cct gag ttttt««at g ac gt aa aat 
c gtgttgagg c C aa= gcc ca t aatg c ggg c t g tt gc cc gg catccaac g c cattc a t gg c 
cat atcaatg attttctggt gcgtaccggg actgca ^ ^ 

cca tg tttta c ggcagtg a g a g c ag a g ata gcg c tg at gt cc ggcgg t g c tttt g cc gtt 4320 
3C9CaCOaCC c tga ac agga gggacagctg atagacacag aagccactgg 
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agcacctcaa 
tggtttcaaa 
aaaagctgtt 
cttgttataa 
taaatggcta 
gtaaaagata 
aacctatatt 
gaaaaggaca 
gaacggcatg 
gaagagtatg 
aggctctttc 
ttagccgaat 
gaagaagaca 
cccgaagagg 
gatggcaaag 
gacattgcct 
ctattttttg 
ctggatgaat 
caccgacttc 
gggcaagggg 
cggccagacg 
ggcaccaggc 
cccgcaagga 
cgacgcgggg 
gccccgcgaa 
gcgcgacagc 
ttcgcgtcgt 
aggaactatg 
cgaggccaag 
ttccttgttc 
ccgctctgcc 



aaacaccatc 
atcggctccg 
ttctggtatt 
ttagcttctt 
aaatgagaat 
cggaaggaat 
taaaaatgac 
tgatgctatg 
atggctggag 
aagatgaaca 
actccatcga 
tggattactt 
ctccatttaa 
aacttgtctt 
taagtggctt 
tctgcgtccg 
acttactggg 
tgttttagta 
ttccgcatca 
tcgctggtat 
gtctacggga 
gg-gtcaaatc 
gggtgaatga 
ttttccgccg 
accttccagt 
gtgcaactgg 
ctcgaacagg 
acgaccaaga 
caggccgcgt 
gatattgcgc 
ctgttcacca 



atacactaaa 
tcgatactat 
taaggtttta 

ggggtatctt 

atcaccggaa 
gtctcctgct 
ggacagccgg 
gctggaagga 
caatctgctc 
aagccctgaa 
catatcggat 
actgaataac 
agatccgcgc 
ttcccacggc 
tattgatctt 
gtcgatcagg 
gatcaagcct 
cctagatgtg 
agtgttttgg 
tcgtgcaggg 
ccgacttcat 
aggaataagg 
atcggacgtt 
aggatgccga 
ccgtcggctc 
ctccccctgc 
aggcggcagg 
agcgaaaaac 
tgctgaaaca 
cgtggccgga 
cgcgcaacaa 
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tcagtaagtt 
gttatacgcc 
gaatgcaagg 
taaatactgt 
ttgaaaaaac 
aaggtatata 
tataaaggga 
aagctgcctg 
atgagtgagg 
aagattatcg 
tg-tccctata 
gatctggccg 
gagctgtatg 
gacctgggag 
gggagaagcg 
gaggatatcg 
gattgggaga 
gcgcaacgat 
ctctcaggcc 
caagattcgg 
tgccgataag 
gcacattgcc 
tgaccggaag 
aaccatcgca 
gatggtccag 
cctgcccgcg 
tttggcgaag 
cgccggcgag 
cacgaagcag 
cacgatgcga 
gaaaatcccg 



ggcag-catca 
aactttgaaa 
aacagtgaat 
agaaaagagg 
tgatcgaaaa 
agctggtggg 
ccacctatga 
ttccaaaggt 
ccgatggcgt 
agctgtatgc 
cgaatagctt 
atgtggattg 
attttttaaa 
acagcaacat 
gcagggcgga 
gggaagaaca 
aaataaaata 
gccgrgcgaca 
gaggcccacg 
aataccaagt 
gtggattatc 
ccggcgtgag 
gcatacaggc 
agccgcaccg 
caagctacgg 
ccatc'ggccg 
tcgatgacca 
gacctggcaa 
cagatcaagg 
gcgatgccaa 
cgcgaggcgc 



cccataattg 
acaactttga 
tggagttcgt 
aaggaaataa 
ataccgctgc 
agaaaatgaa 
tgtggaacgg 
cctgcacttt 
cctttgctcg 
ggagtgcatc 
agacagccgc 
cgaaaactgg 
gacggaaaag 
ctttgtgaaa 
caagtggtat 
gtatgtcgag 
ttatatttta 
agcaggagcg 
gcaagtattt 
acgagaagga 
tggacaccaa 
tcggggcaat 
aagaactgat 
tcatgcgtgc 
ccaagatcga 
ccgtggagcg 
tcgacacgcg 
aacaggtcag 
aaatgcagct 
acgacacggc 
tgcaaaacaa 



4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
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ggtcattttc cacgtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc 6300 

cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360. 

cgagccgatc accttcacgt tctacgagct ttgccaggac ctgggctggt cgatcaatgg 6420 

ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt 6480 

cacgtccgac cgcgttgggc acctggaatc ggtgtcgctg ctgcaccgct tccgcgtcct 6540 

ggaccgtggc aagaaaacgt cccgttgcca ggtcctgatc gacgaggaaa tcgtcgtgct 6600 

gtttgctggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac 6660 

15 ggcccgacgg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga 672 0 

aaccttccgc ctcatgtgcg gatcggattc cacccgcgtg aagaagtggc gcgagcaggt 6780 

cggcgaagcc tgcgaagagt tgcgaggcag cggcctggtg gaacacgcct gggtcaatga 6840 

tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 6900 

agccagcgct ttactggcat ttcaggaaca agcgggcact gctcgacgca cttgcttcgc 6960 

tcagtatcgc tcgggacgca cggcgcgctc tacgaactgc cgataaacag aggattaaaa 7020 

ttgacaattg tgattaaggc tcagattcga cggcttggag cggccgacgt gcaggatttc 7 080 

cgcgagatcc gattgtcggc cctgaagaaa gctccagaga tgttcgggtc cgtttacgag 7140 

cacgaggaga aaaagcccat ggaggcgttc gctgaacggt tgcgagatgc cgtggcattc 7200 

ggcgcctaca tcgacggcga gatcattggg ctgtcggtct tcaaacagga ggacggcccc 7260 

35 . aaggacgctc acaaggcgca tctgtccggc gttttcgtgg agcccgaaca gcgaggccga 7320 

ggggtcgccg gtatgctgct gcgggcgttg ccggcgggtt tattgctcgt gatgatcgtc 7380 

cgacagattc caacgggaat ctggtggatg cgcatcttca tcctcggcgc acttaatatt 7440 

tcgctattct ggagcttgtt gtttatttcg gtctaccgcc tgccgggcgg ggtcgcggcg 7500 

.acggtaggcg ctgtgcagcc gctgatggtc gtgttcatct ctgccgctct gctaggtagc 7560 

ccgatacgat tgatggcggt cctgggggct atttgcggaa ctgcgggcgt ggcgctgttg 7620 

gtgttgacac caaacgcagc gctagatcct gtcggcgtcg cagcgggcct ggcgggggcg 7680 

gtttccatgg cgttcggaac cgtgctgacc cgcaagtggc aacctcccgt gcctctgctc 774 0 

acctttaccg cctggcaact ggcggccgga ggacttctgc tcgttccagt agctttagtg 7800 

tttgatccgc caatcccgat gcctacagga accaatgttc tcggcctggc gtggctcggc 7860 

55 ctgatcggag cgggtttaac ctacttcctt tggttccggg ggatctcgcg actcgaacct 7920 

acagttgttt ccttactggg ctttctcagc cccagatctg gggtcgatca gccggggatg 7980 

catcaggccg acagtcggaa cttcgggtcc ccgacctgta ccattcggtg agcaatggat 8040 

aggggagttg atatcgtcaa cgttcacttc taaagaaata gcgccactca gcttcctcag 8100 
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cggctttatc 
cggttaagcg 
tttgatcaca 
tcatccgtgt 
gagcaaagtc 
gcctgtatcg 
tggcaggata 
gacgttttta 
tgcccttcac 
gcaggcgaaa 
agaatagccc 
gaacgtggac 
tgaaccatca 
ccctaaaggg 
ggaagggaag 
gatcggtgcg 
gattaagttg 
aattaattcc 
ggtattatag 
tcaataactg 
tgtgtaatac 
agcttgggtc 
tcgggagcgg 
tcagcaatat 
ccacagtcga 
tcgccatggg 
agttcggctg 
gcttccatcc 
gtagccggat 
gcaggagcaa 
tcccttcccg 



cagcgatttc 
agaaatgaat 
ggcagcaacg 
ttcaaacccg 
tgccgcctta 
agtggtgatt 
tattgtggtg 
atgtactggg 
cgcctggccc 
atcctgtttg 
gagatagggt 
tccaacgtca 
cccaaatcaa 
agcccccgat 
aaagcgaaag 
ggcctcttcg 
ggtaacgcca 
catcttgaaa 
tccaagcaaa 
attatatcag 
ataaattgat 
ccgctcagaa 
cgataccgta 
cacgggtagc 
tgaatccaga 
tcacgacgag 
gcgcgagccc 
gagtacgtgc 
caagcgtatg 
grgtgagatga 
cttcagtgac 



ctattatgtc 
aagaaggctg 
ctctgtcatc 
gcagcttagt 
caacggctct 
ttgtgccgag 
taaacaaatt 
gtggtttttc 
tgagagagtt 
atggtggttc 
tgagtgttgt 
aagggcgaaa 
gttttttggg 
ttagagcttg 
gagcgggcgc 
ctattacgcc 
gggttttccc 
gaaatatagt 
aacataaatt 
ctggtacatt 
gatatagcta 
gaactcgtca 
aagcacgagg 
caacgctatg 
aaagcggcca 
atcctcgccg 
ctgatgctct 
tcgctcgatg 
cagccgccgc 
caggagatcc 
aacgtcgagc 



73 

ggcatagttc 
ataattcgga 
gttacaatca 
tgccgttctt 
cccgctgacg 
ctgccggtcg 
gacgcttaga 
ttttcaccag 
gcagcaagcg 
cgaaatcggc 
tccagtttgg 
aaccgtctat 
gtcgaggtgc 
acggggaaag 
cattcaggct 
agctggcgaa 
agtcacgacg 
ttaaatattt 
tattgatgca 
gccgtagatg 
gcttagctca 
agaaggcgat 
aagcggtcag 
tcctgatagc 
ttttccacca 
tcgggcatgc 
tcgtccagat 
cgatgtttcg 
attgcatcag 
tgccccggca 
acagctgcgc 



tcaagatcga 
tctctgcgag 
acatgctacc 
ccgaatagca 
ccgtcccgga 

gggagctgtt 

caacttaata 
tgagacgggc 
gtccacgctg 
aaaatccctt 
aacaagagtc 
cagggcgatg 
cgtaaagcac 
ccggcgaacg 
gcgcaactgt 
agggggatgt 
ttgtaaaacg 
attgataaaa 
agtttaaatt 
aaagactgag 
tcgggggatc 
agaaggcgat 
cccattcgcc 
ggtccgccac 
tgatattcgg 
gcgccttgag 
catcctgatc 
cttggtggtc 
ccatgatgga 
cttcgcccaa 
aaggaacgcc 



cagcctgtca 
ggagatgata 
ctccgcgaga 
tcggtaacat 
ctgatgggct 
ggctggctgg 
acacattgcg 
aacagctgat 
gtttgcccca 
ataaatcaaa 
cactattaaa " 
gcccactacg 
taaatcggaa 
tggcgagaaa 
tgggaagggc 
gctgcaaggc 
acggccagtg 
taacaagtca 
cagaaatatt 
tgcgatatta 
cgtcgaagct 
gcgctgcgaa 
gccaagctct 
acccagccgg 
caagcaggca 
cctggcgaac 
gacaagaccg 
gaatgggcag 
tactttctcg 
tagcagccag 
cgtcgtggcc 
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8520 

8580 
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9120 

9180 
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9780 
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agccacgata gccgcgctgc ctcgtcctgc 
ttgacaaaaa gaaccgggcg cccctgcgct 
5 ccgattgtct gttgtgccca gtcatagccg 
cctgcgtgca atccatcttg ttcaatccaa 
tctggattga gagtgaatat gagactctaa 

10 

. agtggagcat ttttgacaag aaatatttgc 
acgcgcaata atggtttctg acgtatgtgc 
15 tgagtggctc cttcaacgtt gcggttctgt 
gtcatcggcg ggggtcataa cgtgactccc 
gcgccatcag atccttggcg gcaagaaagc 

20 

cttaccagag ggcgccccag ctggcaattc 
^Jjjrm gtctagctat cgccatgtaa gcccactgca 

^^^25 ttcccttgtc cagatagccc agtagctgac 
actggctttc tacgtgttcc gcttccttta 
gcgtgaagct tgcatgcctg caggtcgacg 

30 

attgccacta aacgtctaaa cccttgtaat 
tttgatttgc gataaatttt tatatttggt 
35 tttgccaaca cttagcaatt tgcaagttga 
aaatacatat actaatcaac tggaaatgta 
attaaagtga gtgaatatgg taccacaagg 

40 

ggatggcata tacaccaaac attcaataat 

♦tttgaggtgc atgaacgtca cgtggacaaa 
5 taccacacac aagttttgag gtgcatgcat 
tggaaatgat ttgcatggaa gccatgtgta 
aatgaagaaa actacaaatt tacatgcaac 

50 

ttttgcaata ctttcattca tacacactca 
agccagcaga tctgccggca tcgatcccgg 
55 acgcctatga tcgcatgata tttgctttca 
gcatgtgtag ctcagatcct taccgccggt 
ttactatcgt atttttatga ataatattct 

60 

gctcggcgcg cctctagagg atcgatgaat 
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agttcattca 


gggcaccgga 


caggtcggtc 


10020 


gacagccgga 


acacggcggc 


atcagagcag 


10080 


aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


gctcccatgg 


gccctcgact 


agagtcgaga 


10200 


ttggataccg 


aggggaattt 


atggaacgtc 


10260 


tagctgatag tgaccttagg cgacttttga 


10320 


ttagctcatt 


aaactccaga 


aacccgcggc 


10380 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


10440 


ttaattctcc 


gctcatgatc 


ttgatcccct 


10500 


catccagttit actttgcagg gcttcccaac 


10560 


cggnT-cgccn 


gctgtccata 


aaaccgccca 


10620 


agctacctgc 


tttctctttg 


cgcttgcgtt 


10680 


at tcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


gcagcccccg 


cgccctgagt 


gcttgcggca 


10800 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


4- 4— 4-4-4- *-j-t+- 


tttactatgt 


gtgttatgta 


10920 


aCLaaaLULa 


taacaccttt 


tatgctaacg 


10980 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aatatttgct 


aatatttcta 


ctataggaga 


11100 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340 


aaaccatgac 


atccacttgg aggatgcaat 


11400 


tagttatgca 


tgtagtctat 


ataatgagga 


11460 


ctaagtttta 


cacgattata 


atttcttcat 


11520 


gccatggcct 


gctttaatga 


gatatgcgag 


11580 


attctgttgt 


gcacgttgta 


aaaaacctga 


11640 


ttcggttcat 


tctaatgaat 


atatcacccg 


11700 


ccgttcaatt 


tactgattgt 


ccgtcgacga 


11760 


tcagatcggc 


tgagtggctc 


cttcaacgtt 


11820 
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gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa 11880 
cgtgactccc ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac 11940 
tatcagtgtt tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga 12000 
ataatcggat atttaaaagg gcgtgaaaag gtttatcctt cgtccatttg tatgtgcatg 12060 

ccaaccacag ggttcccca „ ^ 

12079 

<210> 30 
<211> 13002 
<212> DNA 

<213> artificial sequence 
<220> 

<223> sS^siiSett^ 83 ^^ ZW6i ^tor-Terxninator-Expre 
<400> 30 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 
gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca 
tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc 180 
ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac gatcaggggt 240 
atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg' aacgcgcgga 300 
ttctttatca ctgataagtt ggtgga.cata ttatgtttat cagtgataaa gtgtcaagca 360 
tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg aacgaggtcg 420 
gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag cagccggcgc 480 
tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa gccatgctgg 540 
cggagaatca tacgcattcg gtgccgagag ccgacgacga otggcgctca tttctgatcg 
ggaatgcccg cagcttoagg caggcgctgc tcgcctaccg cgatggcgcg cgcatccatg 
ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt cgcttcctct 
gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc agctacttca 
ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag cgcggcggca 840 
ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc ttcgacgaag 900 
ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga ttggcgaaaa 960 
ggaggctogt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga tcaggaccgc 1020 
tgccggagcg caacccactc actaoagcag agccatgtag acaacatccc ctcccccttt 1080 
ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct gccctagcgt 114 0 
ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt ccgcttcctc 1200 
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 1260 
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ggcggtaata 
aggccagcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
ccgctgcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
ctaccgccgg 
agggcagccc 
aggcggcggc 
aaatcacggg 

tgggccgcct 

tcggtgatgc 
gcaaggtcat 
aacggccggg 
gacttcgcgg 
gacgctcacc 
cgcgccagaa 
cctcgcggaa 
cgactcaccc 
gagctggcca 
gatgtggaca 
tgacagatga 
gcacctattg 
ccgcccgttt 
aaaccttgtt 
tgccccccct 
tgcgcccctc 
ttgccgggat 



cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 
acctatcaag 
ggccggcatg 
cgtcgtggac 
gggcggcctg 
cacgatcctc 
gatgggcgtg 
gggtgcgcgt 
agctggtgaa 
gggctggttg 
acgccgtcga 
aacttggccc 
ggcgcggcgt 
gcctcgcaaa 
agcctgggga 
ggggcgcgat 
acatttgagg 
ttcggccacc 
tttaaccagg 
tctcgaaccc 
ggccgcgaac 
cggggcagta 



cagaatcagg 
accgtaaaaa 
acaaaaatcg 
cgtttccccc 
acctgtccgc 

ggggtcatta 

tgccaaaggg 
ggtgaagtag 
gcggtgctca 
gagggcaagc 
gtgtactgcc 
agcctgtcgg 
tatgagcacg 
ctgaaactct 
gccctgctgg 
gtccgcccga 
gattgccaag 
gtacatcacc 
ccctcgccgc 
agccgtgtgc 
tcactgacag 
tgacagatga 
tcggcgaaaa 
taagtgccct 
ccttgacact 
ggctgtccac 
gctaacctgt 
gctgcgccct 
tcccggcccg 
ggcctcaccc 
acgggatggg 



ggataacgca 
ggccgcgttg 
acgctcaagt 
tggaagctcc 
ctttctccct 
tagcgatttt 
ttcgtgtaga 
gcccacccgc 
acgggaatcc 
ggatggctga 
ttccagacga 
cctacctgct 
tccgcgagct 
ggctcaccga 
cgaagatcga 
gggcagagcc 
cacgtcccca 
gacgagcaag 
tgggctggcg 
gagacaccgc 
atgaggggcg 
ggggcaggct 
cgcctgattt 
gcggtattga 
tgaggggcag 
aggcagaaaa 
cttttaacct 
gtgcgcgtga 
ctaacgcggg 
caaaaatggc 
cgatcagccc 



ggaaagaaca 
ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 
acgaagagcg 
ggccgtcggc 
ggcccgcatc 
cgacccgcgc 
agagaagcag 
atgacttttt 
tgcgctccat 
gcaagaccga 
gccgtctatg 
ggccgccggc 
gacgttgaca 
cgatttcggc 
tacgcgagtt 
cacttgaggg 
agtgctgaca 
tccagcattt 
gcttttaaac 
ccgcgcacgc 
cctcccatcc 
agcgctggca 
gagcgcgacg 



tgtgagcaaa 
tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttt 
ccatcctttt 
tgtatccaac 
tccttcttca 
ggctggccgg 
ccaaccagga 
attgaggaaa 
cagggctaca 
aatggcgacc 
acggcgcggt 
gacgagcttg 
tagccgctaa 
caagaagagc 
gcgcctttgc 
gccctgcaaa 
gttgtggata 
cttgaggggc 
cggcgacgtg 
tcccacagat 
gcgcgactac 
gatgaggggc 
gcaagggttt 
caatatttat 
cgaagggggg 
ccccaggggc 
gtccttgcca 
cccggaagca 
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1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

246*0 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 
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3060 
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ttgacgtgcc 
gcggcctggg 
cggggccggc 
tgttcggggg 
gtatgaaaac 
ctaccaagac 
tactgataag 
ggcaaggcat 
tgcatggact 
attgggtaat 
tgtcatgcag 
gctgcctcag 
gcagctttcc 
cgtcaaaggg 
atacgtgcgc 
gcgatttagc 
tgcccggctg 
cgtgttgagg 
catatcaatg 
ccatgtttta 
acgcaccacc 
agcacctcaa 
tggtttcaaa 
aaaagctgtt 
cttgttataa 
taaatggcta 
gtaaaagata 
aacctatatt 
gaaaaggaca 
gaacggcatg 
gaagagtatg 



gcaggtgctg 
tggcggcctg 
aatttttacc 
tgcgataaac 
gagaattgga 
gaagaggatg 
ataatatatc 
aggcagcgcg 
aatgcttgaa 
gactccaact 
ctccaccgat 
attcaggtta 
cttcaggcgg 
tgacagcagg 
aacaaccgtc 
cccgacatag 
tatgcgcgag 
ccaacgccca 
attttctggt 
cggcagtgag 
ccgtcagtag 
aaacaccatc 
atcggctccg 
ttctggtatt 
ttagcttctt 
aaatgagaat 
cggaaggaat 
taaaaatgac 
tgatgctatg 
atggctggag 
aagatgaaca 



gcatcgacat 
cccttcactt 
ttgggcattc 
ccagcgaacc 
cctttacaga 
aagaggatga 
ttttatatag 
cttatcaata 
acccaggaca 
tattgatagt 
tttgagaacg 
tgccgctcaa 
gattcataca 
ctcataagac 
ttccggagac 
ccccactgtt 
gttaccgact 
taatgcgggc 
gcgtaccggg 
agcagagata 
ctgaacagga 
atacactaaa 
tcgatactat 
taaggtttta 
ggggtatctt 
atcaccggaa 
gtctcctgct 
ggacagccgg 
gctggaagga 
caatctgctc 
aagccctgaa 



tcagcgacca 
cggccgtcgg 
ttggcatagt 
atttgaggtg 
attactctat 
ggaggcagat 
aagatatcgc 
tatctataga 
ataaccttat 
gttttatgtt 
acagcgactt 
ttcgctgcgt 
gcggccagcc 
gccccagcgt 
tgtcatacgc 
cgtccatttc 
gcggcctgag 
tgttgcccgg 
ttgagaagcg 
gcgctgatgt 
gggacagctg 
tcagtaagtt 
gttatacgcc 
gaatgcaagg 
taaatactgt 
ttgaaaaaac 
aaggtatata 
tataaaggga 
aagctgcctg 
atgagtgagg 
aagattatcg 



ggtgccgggc 
ggcattcacg 
ggtcgcgggt 
ataggtaaga 
gaagcgccat 
tgccttgaat 
cgtatgtaag 
atgggcaaag 
agcttgtaaa 
cagataatgc 
ccgtcccagc 
atatcgcttg 
atccgtcatc 
cgccatagtg 
gtaaaacagc 
cgcgcagacg 
ttttttaagt 
catccaacgc 
gtgtaagtga 
ccggcggtgc 
atagacacag 
ggcagcatca 
aactttgaaa 
aacagtgaat 
agaaaagagg 
tgatcgaaaa 
agctggtggg 
ccacctatga 
ttccaaaggt 
ccgatggcgt 
agctgtatgc 



agtgagggcg 
gacttcatgg 
gccgtgctcg 
ttataccgag 
atttaaaaag 
atattgacaa 
gatttcaggg 
cataaaaact 
ttctatcata 
ccgatgactt 
cgtgccaggt 
ctgattacgt 
catatcacca 
cgttcaccga 
cagcgctggc 
atgacgtcac 
gacgtaaaat 
cattcatggc 
actgcagttg 
ttttgccgtt 
aagccactgg 
cccataattg 
acaactttga 
tggagttcgt 
aaggaaataa 
ataccgctgc 
agaaaatgaa 
tgtggaacgg 
cctgcacttt 
cctttgctcg 
ggagtgcatc 
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aggctctttc 
ttagccgaat 
gaagaagaca 
cccgaagagg 
gatggcaaag 
gacattgcct 
ctattttttg 
ctggatgaat 
caccgacttc 
gggcaagggg 
cggccagacg 
ggcaccaggc 
cccgcaagga 
cgacgcgggg 
gccccgcgaa 
gcgcgacagc 
ttcgcgtcgt 
aggaactatg 
cgaggccaag 
ttccttgttc 
ccgctctgcc 
ggtcattttc 
cgacgatgac 
cgagccgatc 
ccggtattac 
cacgtccgac 
ggaccgtggc 
gtttgctggc 
ggcccgacgg 
aaccttccgc 
cggcgaagcc 



actccatcga 
tggattactt 
ctccatttaa 
aacttgtctt 
taagtggctt 
tctgcgtccg 
acttactggg 
tgttttagta 
ttccgcatca 
tcgctggtat 
gtctacggga 
gggtcaaatc 
Srggtgaatga 
ttttccgccg 
accttccagt 
gtgcaactgg 
ctcgaacagg 
acgaccaaga 
caggccgcgt 
gatattgcgc 
ctgttcacca 
cacgtcaaca 
gaactggtgt 
accttcacgt 
acgaaggccg 
cgcgttgggc 
aagaaaacgt 
gaccactaca 
atgttcgact 
ctcatgtgcg 
tgcgaagagt 



catatcggat 
actgaataac 
agatccgcgc 
ttcccacggc 
tattgatctt 
gtcgatcagg 
gatcaagcct 
cctagatgtg 
agtgttttgg 
tcgtgcaggg 
ccgacttcat 
aggaataagg 
atcggacgtt 
aggatgccga 
ccgtcggctc 
ctccccctgc 
aggcggcagg 
agcgaaaaac 
tgctgaaaca 
cgtggccgga 
cgcgcaacaa 
aggacgtgaa 
ggcagcaggt 
tctacgagct 
aggaatgcct 
acctggaatc 
cccgttgcca 
cgaaattcat 
atttcagctc 
gatcggattc 
tgcgaggcag 



78 

tgtccctata 
gatctggccg 
gagctgtatg 
gacctgggag 
gggagaagcg 
gaggatatcg 
gattgggaga 
gcgcaacgat 
ctctcaggcc 
caagattcgg 
tgccgataag 
gcacattgcc 
tgaccggaag 
aaccatcgca 
gatggtccag 
cctgcccgcg 
tttggcgaag 
cgccggcgag 
cacgaagcag 
cacgatgcga 
gaaaatcccg 
gatcacctac 
gttggagtac 
ttgccaggac 
gtcgcgccta 
ggtgtcgctg 
ggtcctgatc 
atgggagaag 
gcaccgggag 
cacccgcgtg 
cggcctggtg 



cgaatagctt 
atgtggattg 
attttttaaa 
acagcaacat 
gcagggcgga 
gggaagaaca 
aaataaaata 
gccggcgaca 
gaggcccacg 
aataccaagt 
gtggattatc 
ccggcgtgag 
gcatacaggc 
agccgcaccg 
caagctacgg 
ccatcggccg 
tcgatgacca 
gacctggcaa 
cagatcaagg 
gcgatgccaa 
cgcgaggcgc 
accggcgtcg 
gcgaagcgca 
ctgggctggt 
caggcgacgg 
ctgcaccgct 
gacgaggaaa 
taccgcaagc 
ccgtacccgc 
aagaagtggc 
.gaacacgcct 



agacagccgc 
cgaaaactgg 
gacggaaaag 
ctttgtgaaa 
caagtggtat 
gtatgtcgag 
ttatatttta 
agcaggagcg 
gcaagtattt 
acgagaagga 
tggacaccaa 
tcggggcaat 
aagaactgat 
tcatgcgtgc 
ccaagatcga 
ccgtggagcg 
tcgacacgcg 
aacaggtcag 
aaatgcagct 
acgacacggc 
tgcaaaacaa 
agctgcgggc 
cccctatcgg 
cgatcaatgg 
cgatgggctt 
tccgcgtcct 
tcgtcgtgct 
tgtcgccgac 
tcaagctgga 
gcgagcaggt 
gggtcaatga 
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tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 6900 

agccagcgct ttactggcat ttcaggaaca agcgggcact gctcgacgca cttgcttcgc 6960 

tcagtatcgc tcgggacgca cggcgcgctc tacgaactgc cgataaacag aggattaaaa 7020 

ttgacaattg tgattaaggc tcagattcga cggcttggag cggccgacgt gcaggatttc 7080 

cgcgagatcc gattgtcggc cctgaagaaa gctccagaga tgttcgggtc cgtttacgag 7140 

cacgaggaga aaaagcccat ggaggcgttc gctgaacggt tgcgagatgc cgtggcattc 7200 

ggcgcctaca tcgacggcga gatcattggg ctgtcggtct tcaaacagga ggacggcccc 7260 

aaggacgctc acaaggcgca tctgtccggc gttttcgtgg agcccgaaca gcgaggccga 7320 

ggggtcgccg gtatgctgct gcgggcgttg ccggcgggtt tattgctcgt gatgatcgtc 7380 

cgacagattc caacgggaat ctggtggatg cgcatcttca tcctcggcgc acttaatatt 7440 

tcgctattct ggagcttgtt gtttatttcg gtctaccgcc tgccgggcgg ggtcgcggcg 7500 

acggtaggcg ctgtgcagcc gctgatggtc gtgttcatct ctgccgctct gctaggtagc 7560 

ccgatacgat tgatggcggt cctgggggct atttgcggaa. ctgcgggcgt ggcgctgttg 7620 

gtgttgacac caaacgcagc gctagatcct gtcggcgtcg cagcgggcct ggcgggggcg 7680 

gtttccatgg cgttcggaac cgtgctgacc cgcaagtggc aacctcccgt gcctctgctc 7740 

acctttaccg cctggcaact ggcggccgga ggacttctgc tcgttccagt agctttagtg 7800 

tttgatccgc caatcccgat gcctacagga accaatgttc tcggcctggc gtggctcggc 7860 

ctgatcggag cgggtttaac ctacttcctt tggttccggg ggatctcgcg actcgaacct 7920 

acagttgttt ccttactggg ctttctcagc cccagatctg gggtcgatca gccggggatg 7980 

catcaggccg acagtcggaa cttcgggtcc ccgacctgta ccattcggtg agcaatggat 8040 

aggggagttg atatcgtcaa cgttcacttc taaagaaata gcgccactca gcttcctcag 8100 

cggctttatc cagcgatttc ctattatgtc ggcatagttc tcaagatcga cagcctgtca 8160 

cggttaagcg agaaatgaat aagaaggctg ataattcgga tctctgcgag ggagatgata 8220 

tttgatcaca ggcagcaacg ctctgtcatc gttacaatca acatgctacc ctccgcgaga 8280 

tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt ccgaatagca tcggtaacat 8340 

gagcaaagtc tgccgcctta caacggctct cccgctgacg ccgtcccgga ctgatgggct 8400 

5s gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg gggagctgtt ggctggctgg 8460 

tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 8520 

gacgttttta atgtactggg gtggtttttc ttttcaccag tgagacgggc aacagctgat 8580 

tgcccttcac cgcctggccc tgagagagtt gcagcaagcg gtccacgctg gtttgcccca 8640 

gcaggcgaaa atcctgtttg atggtggttc cgaaatcggc aaaatccctt ataaatcaaa 8700 
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agaatagccc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 8760 
gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 8820 
tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 
ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcaactgt tgggaagggc 9000 
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060 
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 
aattaattcc catcttgaaa gaaatatagt ttaaatattt attgataaaa taacaagtca 9180 
ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagaaatatt 9240 
tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 9300 
tgtgtaatac ataaattgat gatatagcta gcttagctca tcgggggatc cgtcgaagct 9360 
agcttgggtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat gcgctgcgaa 9420 
tcgggagcgg cgataccgta aagcaogagg aagcggtcag cccattcgcc gccaagctct 9480 
tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9660 
agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
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cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 1062 0 
gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttcccttgtc cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagoccttg cgccctgagt gcttgcggca 10800 
gcgtgaagot tgcatgcctg caggtcgacg gcgcgocgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 1122.0 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 
tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
agccagccca ccgcggtggg cggccgcctg cagtctagaa ggcctcctgc tttaatgaga 11580 
tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 11640 
aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 11700 
atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtcc 11760 
gtcgagcaaa tttacacatt gccactaaac gtctaaaccc ttgtaatttg tttttgtttt 11820 
actatgtgtg ttatgtattt gatttgcgat aaatttttat atttggtact aaatttataa 11880 
caccttttat gctaacgttt gccaacactt agcaatttgc aagttgatta attgattcta 11940 
aattattttt gtcttctaaa tacatatact aatcaactgg aaatgtaaat atttgctaat 12000 
atttotacta taggagaatt aaagtgagtg aatatggtac cacaaggttt ggagatttaa 12060 
ttgttgcaat gctgcatgga tggcatatac accaaacatt caataattct tgaggataat 12120 
aatggtacca cacaagattt gaggtgcatg aacgtcacgt ggacaaaagg tttagtaatt 12180 
tttcaagaca acaatgttac cacacacaag ttttgaggtg catgcatgga tgccctgtgg 12240 
aaagtttaaa aatattttgg aaatgatttg catggaagcc atgtgtaaaa ccatgacatc 12300 
cacttggagg atgcaataat gaagaaaact acaaatttac atgcaactag ttatgcatgt 12360 
agtctatata atgaggattt tgcaatactt tcattcatac acactcacta agttttacac 12420 
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gattataatt tcttcatagc cagcggatcc gatatcgggc ccgctagcgt taaccctgct 12480 

ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca 12540 

cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct 12600 

aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac 12660 

tgattgtccg tcgacgaatt cgagctcggc gcgcctctag aggatcgatg aattcagatc 12720 

ggctgagtgg ctccttcaac gttgcggttc tgtcagttcc aaacgtaaaa cggcttgtcc 12780 

cgcgtcatcg gcgggggtca taacgtgact cccttaattc tccgctcatg atcagattgt 12840 

cgtttcccgc cttcagttta aactatcagt gtttgacagg atatattggc gggtaaacct 12900 

aagagaaaag agcgtttatt agaataatcg gatatttaaa agggcgtgaa aaggtttatc 12960 

cttcgtccat ttgtatgtgc atgccaacca cagggttccc ca 13002 

<210> 31 
<211> 13905 
<212> DNA 

<213> artificial sequence 
<220> 

<223> ssi^iaSettS"" 88101 "^ 0 " ^ Terzninator-B^pre 

<400> 31 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 

gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca 120 ' 

tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc 180 

ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac gatcaggggt 240 

atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg aacgcgcgga 300 

ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa gtgtcaagca 360 

tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg aacgaggtcg 420 

gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag cagccggcgc 480 

tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa gccatgctgg 540 

cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca tttctgatcg 600 

ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg cgcatccatg 660 

ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt cgcttcctct 720 

gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc agctacttca 780 

ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag cgcggcggca 840 

ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc ttcgacgaag 900 
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ccggtccgga 
ggaggctcgt 
tgccggagcg 
ccaccgcgtc 
ccaagcctca 
gctcactgac 
ggcggtaata 
aggccagcaa 
ccgcccccct 
aggactataa 
gaccctgccg 
ccgctgcata 
tcgcacgata 
ggcgtcagcc 
ctgtccctta 
ctaccgccgg 
agggcagccc 
aggcggcggc 
aaatcacggg 
tgggccgcct 
tcggtgatgc 
gcaaggtcat 
aacggccggg 
gacttcgcgg 
gacgctcacc 
cgcgccagaa 
cctcgcggaa 
cgactcaccc 
gagctggcca 
gatgtggaca 
tgacagatga 



cgcagcgttc 
tgtcaggaac 
caacccactc 
agacgcccgt 
cggccgcgct 
tcgctgcgct 
cggttatcca 
aaggccagga 
gacgagcatc 
agataccagg 
cttaccggat 
accctgcttc 
tacaggattt 
gggcaggata 
ttcgcacctg 
cgtaacagat 
acctatcaag 
ggccggcatg 
cgtcgtggac 
gggcggcctg 
cacgatcctc 
gatgggcgtg 
gggtgcgcgt 
agctggtgaa 
gggctggttg 
acgccgtcga 
aacttggccc 
ggcgcggcgt 
gcctcgcaaa 
agcctgggga 

ggggcgcgat 



gagcagggac 
gttgaaggac 
actacagcag 
agcagcccgc 
cggcctctct 
cggtcgttcg 
cagaatcagg 
accgtaaaaa 
acaaaaatcg 
cgtttccccc 
acctgtccgc 

ggggtcatta 

tgccaaaggg 
ggtgaagtag 
gcggtgctca 
gagggcaagc 
gtgtactgcc 
agcctgtcgg 
tatgagcacg 
ctgaaactct 
gccctgctgg 
gtccgcccga 
gattgccaag 
gtacatcacc 
ccctcgccgc 
agccgtgtgc 
tcactgacag 
tgacagatga 
tcggcgaaaa 
taagtgccct 
ccttgacact 
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tcgcggtgat 
cgagaaaggg 
agccatgtag 
tacgggcttt 
ggcggccttc 
gctgcggcga 
ggataacgca 
ggccgcgttg 
acgctcaagt 
tggaagctcc 
ctttctccct 
tagcgatttt 
ttcgtgtaga 
gcccacccgc 
acgggaatcc 
ggatggctga 
ttccagacga 
cctacctgct 
tccgcgagct 
ggctcaccga 
cgaagatcga 
gggcagagcc 
cacgtcccca 
gacgagcaag 
tgggctggcg 
gagacaccgc 
atgaggggcg 
ggggcaggct 
cgcctgattt 
gcggtattga 
tgaggggcag 



tgtcgatgga 
tgacgattga 
acaacatccc 
ttcatgccct 
tggcgctctt 
gcggtatcag 
ggaaagaaca 
ctggcgtttt 
cagaggtggc 
ctcgtgcgct 
tcgggaagcg 
ttcggtatat 
ctttccttgg 
gagcgggtgt 
tgctctgcga 
tgaaaccaag 
acgaagagcg 
ggccgtcggc 
ggcccgcatc 
cgacccgcgc 
agagaagcag 
atgacttttt 
tgcgctccat 
gcaagaccga 
gccgtctatg 
ggccgccggc 
gacgttgaca 
cgatttcggc 
tacgcgagtt 
cacttgaggg 
agtgctgaca 



ttggcgaaaa 
tcaggaccgc 
ctcccccttt 
gccctagcgt 
ccgcttcctc 
ctcactcaaa 
tgtgagcaaa 
tccataggct 
gaaacccgac 
ctcctgttcc 
tggcgctttt 
ccatcctttt 
tgtatccaac 
tccttcttca 
ggctggccgg 
ccaaccagga 
attgaggaaa 
cagggctaca 
aatggcgacc 
acggcgcggt 
gacgagcttg 
tagccgctaa 
caagaagagc 
gcgcctttgc 
gccctgcaaa 
gttgtggata 
cttgaggggc 
cggcgacgtg 
tcccacagat 
gcgcgactac 
gatgaggggc 



960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
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gcacctattg 
ccgcccgttt 
aaaccttgtt 
tgccccccct 
tgcgcccctc 
ttgccgggat 
ttgacgtgcc 
gcggcctggg 
cggggccggc 
tgttcggggg 
gtatgaaaac 
ctaccaagac 
tactgataag 
ggcaaggcat 
tgcatggact 
attgggtaat 
tgtcatgcag 
gctgcctcag 
gcagctttcc 
cgtcaaaggg 
atacgtgcgc 
gcgatttagc 
tgcccggctg 
cgtgttgagg 
catatcaatg 
ccatgtttta 
acgcaccacc 
agcacctcaa 
tggtttcaaa 
aaaagctgtt 
cttgttataa 



acatttgagg 
ttcggccacc 
tttaaccagg 
tctcgaaccc 
ggccgcgaac 
cggggcagta 
gcaggtgctg 
tggcggcctg 
aatttttacc 
tgcgataaac 
gagaattgga 
gaagaggatg 
ataatatatc 
aggcagcgcg 
aatgcttgaa 
gactccaact 
ctccaccgat 
attcaggtta 
cttcaggcgg 
tgacagcagg 
aacaaccgtc 
cccgacatag 
tatgcgcgag 
ccaacgccca 
attttctggt 
cggcagtgag 
ccgtcagtag 
aaacaccatc 
atcggctccg 
ttctggtatt 
ttagcttctt 



ggctgtccac 
gctaacctgt 
gctgcgccct 
tcccggcccg 
ggcctcaccc 
acgggatggg 
gcatcgacat 
cccttcactt 
ttgggcattc 
ccagcgaacc 
cctttacaga 
aagaggatga 
ttttatatag 
cttatcaata 
acccaggaca 
tattgatagt 
tttgagaacg 
tgccgctcaa 
gattcataca 
ctcataagac 
ttccggagac 
ccccactgtt 
gttaccgact 
taatgcgggc 
gcgtaccggg 
agcagagata 
ctgaacagga 
atacactaaa 
tcgatactat 
taaggtttta 

ggggtatctt 
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aggcagaaaa 
cttttaacct 
gtgcgcgtga 
ctaacgcggg 
caaaaatggc 
cgatcagccc 
tcagcgacca 
cggccgtcgg 
ttggcatagt 
atttgaggtg 
attactctat 
Srgaggcagat 
aagatatcgc 
tatctataga 
ataaccttat 
gttttatgtt 
acagcgactt 
ttcgctgcgt 
gcggccagcc 
gccccagcgt 
tgtcatacgc 
cgtccatttc 
gcggcctgag 
tgttgcccgg 
ttgagaagcg 
gcgctgatgt 
gggacagctg 
tcagtaagtt 
gttatacgcc 
gaatgcaagg 
taaatactgt 



tccagcattt 
gcttttaaac 
ccgcgcacgc 
cctcccatcc 
agcgctggca 
gagcgcgacg 
ggtgccgggc 
ggcattcacg 
ggtcgcgggt 
ataggtaaga 
gaagcgccat 
tgccttgaat 
cgtatgtaag 
atgggcaaag 
agcttgtaaa 
cagataatgc 
ccgtcccagc 
atatcgcttg 
atccgtcatc 
cgccatagtg 
gtaaaacagc 
cgcgcagacg 
ttttttaagt 
catccaacgc 
gtgtaagtga 
ccggcggtgc 
atagacacag 
ggcagcatca 
aactttgaaa 
aacagtgaat 
agaaaagagg 



gcaagggttt 
caatatttat 
cgaagggggg 
ccccaggggc 
gtccttgcca 
cccggaagca 
agtgagggcg 
gacttcatgg 
gccgtgctcg 
ttataccgag 
atttaaaaag 
atattgacaa 
gatttcaggg 
cataaaaact 
ttctatcata 
ccgatgactt 
cgtgccaggt 
ctgattacgt 
catatcacca 
cgttcaccga 
cagcgctggc 
atgacgtcac 
gacgtaaaat 
cattcatggc 
actgcagttg 
ttttgccgtt 
aagccactgg 
cccataattg 
acaactttga 
tggagttcgt 
aaggaaataa 
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taaatggcta aaatgagaat atcaccggaa ttgaaaaaac tgatcgaaaa ataccgctgc 4680 

gtaaaagata cggaaggaat gtctcctgct aaggtatata agctggtggg agaaaatgaa 4740 

aacctatatt taaaaatgac ggacagccgg tataaaggga ccacctatga tgtggaacgg 4800 

gaaaaggaca tgatgctatg gctggaagga aagctgcctg ttccaaaggt cctgcacttt 4860 

gaacggcatg atggctggag caatctgctc atgagtgagg ccgatggcgt cctttgctcg 4920 

gaagagtatg aagatgaaca aagccctgaa aagattatcg agctgtatgc ggagtgcatc 4980 

aggctctttc actccatcga catatcggat tgtccctata cgaatagctt agacagccgc 5040 

ttagccgaat tggattactt actgaataac gatctggccg atgtggattg cgaaaactgg 5100 

gaagaagaca ctccatttaa agatccgcgc gagctgtatg attttttaaa gacggaaaag 5160 

cccgaagagg aacttgtctt ttcccacggc gacctgggag acagcaacat ctttgtgaaa 5220 

gatggcaaag taagtggctt tattgatctt gggagaagcg gcagggcgga caagtggtat 5280 

gacattgcct tctgcgtccg gtogatcagg gaggatatcg gggaagaaca gtatgtcgag 5340 

ctattttttg acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta 5400 

ctggatgaat tgttttagta cctagatgtg gcgcaacgat gccggcgaca agcaggagcg 5460 

caccgacttc ttccgcatca agtgttttgg ctctcaggcc gaggcccacg gcaagtattt 5520 

gggcaagggg tcgctggtat tcgtgcaggg caagattcgg aatacoaagt acgagaagga 5580 

cggccagacg gtctacggga ccgacttcat tgccgataag gtggattatc tggacaccaa 5640 

ggcaccaggc gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat 5700 

cccgcaagga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat 5760 

cgacgcgggg ttttccgccg aggatgccga aaccatcgca agccgcaccg tcatgcgtgc 5820 

gccccgcgaa accttccagt ccgtcggctc gatggtccag caagctacgg ccaagatcga 5880 

gcgcgacagc gtgcaactgg ctccccctgc cctgcccgcg ccatcggccg ccgtggagcg 5940 

ttcgcgtcgt ctcgaacagg aggcggcagg tttggcgaag tcgatgacca tcgacacgcg 6000 

aggaactatg acgaccaaga agcgaaaaac cgccggcgag gacctggcaa aacaggtcag 6060 

cgaggccaag caggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaatgcagct 6120 

ttccttgttc gatattgcgc cgtggocgga cacgatgcga gcgatgccaa acgacacggc 6180 

ccgctctgcc ctgttcacca cgcgcaacaa gaaaatcccg cgcgaggcgc tgcaaaacaa 6240 

ggtcattttc cacgtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc 63 00 

cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 63 60 

cgagccgatc accttcacgt tctacgagct ttgccaggac ctgggctggt cgatcaatgg 6420 

ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt 6480 
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cacgtccgac 
ggaccgtggc 
gtttgctggc 
ggcccgacgg 
aaccttccgc 
cggcgaagcc 
tgacctggtg 
agccagcgct 
tcagtatcgc 
ttgacaattg 
cgcgagatcc 
cacgaggaga 
ggcgcctaca 
aaggacgctc 
ggggtcgccg 

cgacagattc 
tcgctattct 
acggtaggcg 
ccgatacgat 
gtgttgacac 
gtttccatgg 
acctttaccg 
tttgatccgc 
ctgatcggag 
acagttgttt 
catcaggccg 
aggggagttg 
cggctttatc 
cggttaagcg 
tttgatcaca 
tcatccgtgt 



cgcgttgggc 
aagaaaacgt 
gaccactaca 
atgttcgact 
ctcatgtgcg 
"tgcgaagagt 
cattgcaaac 
ttactggcat 
tcgggacgca 
tgattaaggc 
gattgtcggc 
aaaagcccat 
tcgacggcga 
acaaggcgca 
gtatgctgct 
caacgggaat 
ggagcttgtt 
ctgtgcagcc 
tgatggcggt 
caaacgcagc 
cgttcggaac 
cctggcaact 
caatcccgat 
cgggtttaac 

ccttactggg 
acagtcggaa 
atatcgtcaa 
cagcgatttc 
agaaatgaat 
ggcagcaacg 
ttcaaacccg 



acctggaatc 
cccgttgcca 
cgaaattcat 
atttcagctc 
gatcggattc 
tgcgaggcag 
gctagggcct 
ttcaggaaca 
cggcgcgctc 
tcagattcga 
cctgaagaaa 
ggaggcgttc 
gatcattggg 
tctgtccggc 
gcgggcgttg 
ctggtggatg 
gtttatttcg 
gctgatggtc 
cctgggggct 
gctagatcct 
cgtgctgacc 
ggcggccgga 
gcctacagga 
ctacttcctt 
ctttctcagc 
cttcgggtcc 
cgttcacttc 
ctattatgtc 
aagaaggctg 
ctctgtcatc 
gcagcttagt 



ggtgtcgctg 
ggtcctgatc 
atgggagaag 
gcaccgggag 
cacccgcgtg 
cggcctggtg 
tgtggggtca 
agcgggcact 
tacgaactgc 
cggcttggag 
gctccagaga 
gctgaacggt 
ctgtcggtct 
gttttcgtgg 
ccggcgggtt 
cgcatcttca 
gtctaccgcc 
gtgttcatct 
atttgcggaa 
gtcggcgtcg 
cgcaagtggc 
ggacttctgc 
accaatgttc 
tggttccggg 
cccagatctg 
ccgacctgta 
taaagaaata 
ggcatagttc 
ataattcgga 
gttacaatca 
tgccgttctt 



ctgcaccgct 
gacgaggaaa 
taccgcaagc 
ccgtacccgc 
aagaagtggc 
gaacacgcct 
gttccggctg 
gctcgacgca 
cgataaacag 
cggccgacgt 
tgttcgggtc 
tgcgagatgc 
tcaaacagga 
agcccgaaca 
tattgctcgt 
tcctcggcgc 
tgccgggcgg 
ctgccgctct 
ctgcgggcgt 
cagcgggcct 
aacctcccgt 
tcgttccagt 
tcggcctggc 
ggatctcgcg 
gggtcgatca 
ccattcggtg 
gcgccactca 
tcaagatcga 
tctctgcgag 
acatgctacc 
ccgaatagca 



tccgcgtcct 
tcgtcgtgct 
tgtcgccgac 
tcaagctgga 
gcgagcaggt 
gggtcaatga 
ggggttcagc 

cttgcttcgc 
aggattaaaa 
gcaggatttc 
cgtttacgag 
cgtggcattc 
ggacggcccc 
gcgaggccga 
gatgatcgtc 
acttaatatt 
ggtcgcggcg 
gctaggtagc 
ggcgctgttg 
ggcgggggcg 
gcctctgctc 
agctttagtg 
gtggctcggc 
actcgaacct 
gccggggatg 
agcaatggat 
gcttcctcag 
cagcctgtca 
ggagatgata 
ctccgcgaga 
tcggtaacat 
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gagcaaagtc 
gcctgtatcg 
tggcaggata 
gacgttttta 
tgcccttcac 
gcaggcgaaa 
agaatagccc 
gaacgtggac 
tgaaccatca 
ccctaaaggg 
ggaagggaag 
gatcggtgcg 
gattaagttg 
aattaattcc 
ggtattatag 
tcaataactg 
tgtgtaatac 
agcttgggtc 
tcgggagcgg 
tcagcaatat 
ccacagtcga 
tcgccatggg 
agttcggctg 
gcttccatcc 
gtagccggat 
gcaggagcaa 
tcccttcccg 
agccacgata 
ttgacaaaaa 
ccgattgtct 
cctgcgtgca 



tgccgcctta 
agtggtgatt 
tattgtggtg 
atgtactggg 
cgcctggccc 
atcctgtttg 
gagatagggt 
tccaacgtca 
cccaaatcaa 
agcccccgat 
aaagcgaaag 
ggcctcttcg 
ggtaacgcca 
catcttgaaa 
tccaagcaaa 
attatatcag 
ataaattgat 
ccgctcagaa 
cgataccgta 
cacgggtagc 
tgaatccaga 
tcacgacgag 
gcgcgagccc 
gagtacgtgc 
caagcgtatg 
ggtgagatga 
cttcagtgac 
gccgcgctgc 
gaaccgggcg 
gttgtgccca 
atccatcttg 



caacggctct 
ttgtgccgag 
taaacaaatt 
gtggtttttc 
tgagagagtt 
atggtggttc 
tgagtgttgt 
aagggcgaaa 
gttttttggg 
ttagagcttg 
gagcgggcgc 
ctattacgcc 
gggttttccc 
gaaatatagt 
aacataaatt 
ctggtacatt 
gatatagcta 
gaactcgtca 
aagcacgagg 
caacgctatg 
aaagcggcca 
atcctcgccg 
ctgatgctct 
tcgctcgatg 
cagccgccgc 
caggagatcc 
aacgtcgagc 
ctcgtcctgc 
cccctgcgct 
gtcatagccg 
ttcaatccaa 
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cccgctgacg 
ctgccggtcg 
gacgcttaga 
ttttcaccag 
gcagcaagcg 
cgaaatcggc 
tccagtttgg 
aaccgtctat 
gtcgaggtgc 
acggggaaag 
cattcaggct 
agctggcgaa 
agtcacgacg 
ttaaatattt 
tattgatgca 
gccgtagatg 
gcttagctca 
agaaggcgat 
aagcggtcag 
tcctgatagc 
ttttccacca 
tcgggcatgc 
tcgtccagat 
cgatgtttcg 
attgcatcag 
tgccccggca 
acagctgcgc 
agttcattca 
gacagccgga 
aatagcctct 
gctcccatgg 



ccgtcccgga 
gggagctgtt 
•caacttaata 
tgagacgggc 
gtccacgctg 
aaaatccctt 
aacaagagtc 
cagggcgatg 
cgtaaagcac 
ccggcgaacg 
gcgcaactgt 

agggggatgt 

ttgtaaaacg 
attgataaaa 
agtttaaatt 
aaagactgag 
tcgggggatc 
agaaggcgat 
cccattcgcc 
ggtccgccac 
tgatattcgg 
gcgccttgag 
catcctgatc 
cttggtggtc 
ccatgatgga 
cttcgcccaa 
aaggaacgcc 
gggcaccgga 
acacggcggc 
ccacccaagc 
gccctcgact 



ctgatgggct 
ggctggctgg 
acacattgcg 
aacagctgat 
gtttgcccca 
ataaatcaaa 
cactattaaa 
gcccactacg 
taaatcggaa 
tggcgagaaa 
tgggaagggc 
gctgcaaggc 
acggccagtg 
taacaagtca 
cagaaatatt 
tgcgatatta 
cgtcgaagct 
gcgctgcgaa 
gccaagctct 
acccagccgg 
caagcaggca 
cctggcgaac 
gacaagaccg 
gaatgggcag 
tactttctcg 
tagcagccag 
cgtcgtggcc 
caggtcggtc 
atcagagcag 
ggccggagaa 
agagtcgaga 
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10200 
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tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaaotccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atcottggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
cttaocagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 
gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttcccttotc cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagoccttg cgccctgagt gcttgcggca 10800 
gcgtgaagct tgcatgcctg caggtcgacg gcgogccgag ctcctcgagc aaatttacac 10860 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg tacoacaagg tttggagatt taattgttgc aatgctgcat 11160 
• ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 11220 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
tacoacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 
tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttoattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
agccagccca ccgcggtggg cggccgcctg cagtctagaa ggcctcctgc tttaatgaga 11580 
tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 11640 
aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 11700 
atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtcc 11760 
gtcgagcaaa tttacacatt gccactaaac gtctaaaccc ttgtaatttg tttttgtttt 11820 
actatgtgtg ttatgtattt gatttgcgat aaatttttat atttggtact aaatttataa 11880 
caccttttat gctaacgttt gccaacactt agcaatttgc aagttgatta attgattcta 11940 
aattattttt gtcttctaaa tacatatact aatcaactgg aaatgtaaat atttgctaat 12000 
atttctacta taggagaatt aaagtgagtg aatatggtac cacaaggttt ggagatttaa 12060 



10 



15 



20 



5 



BASF Plant Science GmbH 20030015 PF 54305 DE 

89 

Ctottoeut gctgcatgga tggcatatac accaaacatt caataattct tgaggataat 12120 
aatggtacca cacaagattt gaggtgcatg aacgtcacgt ggacaaaagg tttagtaatt l 2180 
tttcaagaca acaatgttac cacacacaag ttttgaggtg catgcatgga tgccctgtgg l 2240 
aaagtttaaa aatattttgg aaatga ttt g catggaagcc atgtgtaaaa ccatgacatc 12300 
cacttggagg atgcaataat gaagaaaact acaaatttac atgcaactag ttatgcatgt: l 23 60 
agtctatata atgaggattt tgcaatactt tcattcatac acactcacta agttttacac 12420 
gattataatt tcttcatagc cagcggatcc gatatcgggc ccgctagcgt taaccctgct 12480 
ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca 12540 
cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct 12600 
aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac 12 660 
tgattgtccg tcgagcaaat ttacacattg ccactaaacg tctaaaccct tgtaatttgt 12720 
ttttotttt. ctatgtgtgt tatgtatttg atttgcgata aatttttata tttggtacta 12780 
aatttataac accttttatg ctaacg ttt g ccaacactta gcaatttgca agttgattaa 12840 
ttgattctaa attatttttg tcttctaaat acatatacta atcaactgga aatgtaaata 12900 
tttgctaata tttctactat aggagaatta aagtgagtga atatggtacc acaaggtttg 12960 
gagatttaat tgttgcaatg ctgcatggat ggcatataca ccaaacattc aataattctt 13020 
gaggataata atggtaccac acaagatttg aggtgcatga acgtcacgtg gacaaaagg t 13 080 
ttagtaattt ttcaagacaa caatgttacc acacacaagt t tt gaggtgc atgcatggat l 31 40 
gccctgtgga aagtttaaaa atattttgga aatgatttgc atggaagcca tgtgtaaaac 13200 
catgacatcc acttggagga ' tgcaataatg aagaaaacta caaatttaca tgcaactagt 13260 
tatgcatgta gtctatataa tgaggatttt gcaatacttt cattcataca cactcactaa 133 2 0 
gttttacacg attataattt cttcatagcc agcagatctg ccggcatcga tcccgggcca 13380 
tggcctgctt taatgagata tgcgagacgc ctatgatcgc atgatatttg ctttcaattc 13440 
tgttgtgcac gttgtaaaaa acctgagcat gtgtagctca gatccttacc gccggtttcg 13 500 
gttcattcta atgaatatat cacccgttac tatcgtattt ttatgaataa tattctccgt 13560 
tcaatttact gattgtccgt cgacgagctc ggcgcgcctc tagaggatcg atgaattcag 136 20 
atcggctgag tggctccttc aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg 13680 
tcccgcgtca tcggcggg gg tcataacgtg actcccttaa ttctccgctc atgatcagat 13740 

tgtcgtttcc cgccttcagt ttaaactatc agtgtttaac am™^^^ 

aai-gcccgac aggatatatt ggcgggtaaa 13800 

cctaagagaa aagagcgttt attagaataa tcggatattt aa^rr^^ 

ui-ygacaccc aaaagggcgt gaaaaggttt 13860 

atccttcgtc catttgtatg tgcatgccaa ccacagggtt cccca 139Q5 
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<210> 


32 


<211> 


1443 


<212> 


DNA 


<213> 


Phaeodactyl 


<220> 




<221> 


CDS 


<222> 


(9) . . (1442) 


<223> 






<400> 32 

gatctaaa atg ggc aaa gga ggg gac get egg gec teg aag ggc tea aca 50 
15 Met Gly Lys Gly Gly Asp Ala Arg Ala Se? LyI S?y Ser S 

1 5 10 

??! agt tSfg Cag gaa gtc aa ^ ac «= «c gcg tct ccg 98 

20 £ 9 ^ ^ TrP Gln GlU Val L * s Thr His ^ a Ser So 

X3 20 25 30 

II 9 !~ ?r £ TO ^ C CaC tCC aat aag gtc tac 3*c gtg tec aac 

Glu Asp Ala Trp lie He His Ser Asn Lys Val Tyr Asp Val Ser Asn 

r 25 35 40 45 

tgg cac gaa cat cce gga ggc gee gtc att ttc acg cac gee ggt gac 
Trp Has Glu Hxs Pro Gly Gly Ala Val He Phe Th? His 111 £J 

55 go 



30 




50 



gac atg acg gac att ttc get gec ttt cac gca cce gga teg cag teg 
Asp Met Thr Asp He Phe Ala Ala Phe His Ala Pro Gxy III SS Ser 
65 70 75 



ctg cac cac cag gtc ttc ace aag cgc aag cac ggg gat etc gga aoa 
60 H " fX LYS ^ HlS S Lp Leu S S5 

etc ttt tgg ggg aac etc atg cag ggt tac tec gta cag tgg tgg aaa 



146 



194 



242 



35 Su Me? Zl 2? ^ S f! gg ° £f a 5 tg _ ctc ~ g gaa -cc ace ggc 



Leu Met Lys Lys Phe Tyr He Gly Glu Leu L^u ^ Glu Thr Sr G?y 
80 85 90 

?? g »° ff ° ag °f a atC gCC fctt gaa aag ^ c ta = cg-= Sat ctg cgc 338 
Lys Glu Pro Gln Gln lie Ala Phe Glu Lys Gly Tyr Arg Asp LeS Arg 

100 105 110 

tec aaa etc ate atg atg ggc atg ttc aag tec aac aag tgg ttc tac ™ fi 
Ser Lys Leu He Met Met Gly Met Phe Lys Ser Asn Lys j£ Pne 
115 120 125 

Sal £^ Jf* r CtC o g<= atg gCC att tgg gcc * cc gee tgt get 434 

Val Tyr Lys Cys Leu Ser Asn Met Ala He Trp Ala Ala Ala Cys Ala 

130 135 140 

S 6 ? 2* ta<= tCg ga ° cgc ttc g ta cac ctg gcc age gcc gtc 

Leu Val Phe Tyr Ser Asp Arg Phe Trp Val His LeS Ala Ser HI Si 
145 150 155 



482 



» atg ctg gga aca ttc ttt cag cag teg gga tgg ttg gea cac gac ttt «n 
55 Met Leu Gly Thr Phe Phe Gln Gln Ser Gly Tr? Leu 111 His Isp Pne 30 
XDU i^S 170 



578 



626 
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Leu Phe Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp Lys 
195 200 205 



aac aag cac aac gga cac cac gcc gtc ccc aac etc cac too tec t ce zia 
5 Asn Lys His Asn Gly His His Ala Val Pro Asn Leu Ss Cys Ser Ser ^ 

215 220 

gca gtc gcg caa gat ggg gac ccg gac ate gat acc atg ccc cth 
10 3 f 2 l ASP ° ly ASP *X ASP Ile ^ ^ S? Pro Leu Leu 



230 235 



15 



gcc tgg tec gtc cag caa gcc cag tct tac egg gaa etc caa eee me . 
Ala Trp ser Val Gin Gin Ala Gin Ser Tyr Arg fl* 2u Sn £a £p 



250 



20 



) 



345 350 



gcg tec tgt gga ttc ttg etc gcc att gtc ttt ggc etc ggc cac aac 
Ala Ser Cys Gly Phe Leu Leu Ala lie Val Phe Gly Leu STy His Un 
355 360 365 



375 3 8 o 

of* S*? S£ ° ^ ° gC aac gtc acg AW* 3 ^ a <=*<= ggt ttc ccc caa 

Gin Val Thr Thr Thr Arg Asn Val Thr Gly Gly His Sfy Phe Pro Sn 
385 390 395 



415 420 425 430 

Leu Val ^ o£ C I ffC ^ W tgff ggt gtC Cag tac <=ac ff« gcc 

Leu val Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr His Glu lit 

435 ■ 440 445 



722 



770 



gga aag gat teg ggt ttg gtc aag ttc atg ate cgt aac caa tec tac 
Gly Lys Asp ser Gly Leu Val Lys Phe Met -He Arg Asn cJn Ser Tyr 

260 265 270 

2 2 E SS S 2 22 S 2 2 2 2 2 2 S 

275 280 285 

tec ttc aag tgc gcc ttt ggg ctt gga get gcg teg gag aac act act 
Ser Phe Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Slu Asn S 52 
290 295 300 

} £ s; 2 2 s 2 s e s 2 s 2 2 s e e 

S E 2 2 E 2 S 2 2 E £ 2 2 2 2 E 1010 

j 325 330 

5 2 E 2 E S 2 S S E 2 E E £ S S 1058 



818 



866 



914 



962 



1106 



: S5 2 K 2 22 E 2 S 2 2 2 E 2 2 2 1154 



1202 



1250 



f?° ^ S*? ga ° tgS ttC tgt ggt ^ c ctc cag tac caa gtc gac cac 
Ala Phe Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp Ss 
u 405 410 

cac tta ttc ccc age ctg ccc cga cac aat ctg gcc aag aca cac aca l?on 
Hxs Leu Phe Pro Ser Leu Pro Arg His Asn Leu Ala LyS Thr Ss S 



1346 
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S £ S C Sg S SS S S2 £ 2 S 2 S g - ™ 

5 455 460 

s s s s ss s s £ SS s S S S S 2 - • "« 

470 475 

10 

<210> 33 
<211> 477 
<212> PRT 

15 <213> Phaeodact y lum tricomutum 

<400> 33 

Met Gly Lys Gly ffly Asp Ala Arg Ala Ser Lys G l y Ser Thr Ala Ala 
20 10 15 

Arg Lys He Ser Trp Gin Glu Val Lys Thr His Ala Ser Pro Glu Asp 

25 30 



25 

Ala Trp lie He His Ser Asn Lys Val Tyr Asp Val Ser Asn Trp His 

40 45 

30 Glu His Pro Gly Gly Ala Val Xle Phe Thr His Ala Gly Asp Asp Met 



35 IT 116 PhS Ala A J a Pte His W *r° My ser Gin Ser Leu Met 

70 75 80 

lys Lys Phe Tyr lie Gly Glu Leu Leu Pro Glu Thr Thr Gly Lys Glu 



40 



90 



95 




Pro Gin Gin lie Ala Phe Glu Lys Gly Tyr Arg Asp Leu Arg Ser Lys 



110 



Leu He Met Met Gly Met Phe Lys Ser Asn Lys Trp Phe Tyr Val Tyr 

120 125 

50 Lys Cys Leu Ser Asn Met Ala He Trp Ala Ala Ala Cys Ala Leu Val 



55 145 



Phe Tyr Ser Asp Arg Phe Trp Val His Leu Ala 



150 



155 



140 



Ser Ala Val Met Leu 
160 



Gly Thr Phe Phe Gin Gin Ser Gly Trp Leu Ala His Asp Phe Leu His 



60 ~~ 17 ° 175 

His Gin Val Phe Thr Lys Arg Lys His Gly Asp Leu Gly Gly 



Leu Phe 
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180 



185 



190 



Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp Lys Asn Lys 

-200 205 



His Asn Gly His His Ala Val Pro Asn Leu His Cys Ser Ser Ala Val 



10 



15 



215 



220 



Ala Gin Asp Gly Asp Pro Asp He Asp Thr Met Pro Leu Leu Ala Trp 



235 



240 



Ser val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin Ala Asp Gly Lys 
245 250 255 

20 Asp Ser Gly Leu Val Lys Phe Met He Arg Asn Gin Ser Tyr Phe Tyr 




2 65 



270 



25 



30 



35 



40 



Phe Pro lie Leu Leu Leu Ala Arg Leu Ser Trp Leu Asn Glu . 



275 



280 



Ser Phe 



285 



Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Ala Leu Glu 



295 



300 



Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu Glu Lys Ala Gly He 



310 



315 



320 



# 



50 



55 



60 



Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser Ser Gly Phe Gly Arg 
325 330 335 

Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu Thr Ala Thr Ala Ser 
340 345 35 0 

Cys Gly Phe Leu Leu Ala He Val Phe Gly Leu Gly His Asn Gly Met 

360 365 

Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe Trp Lys Leu Gin Val 

380 

*hr Thr Thr Arg Asn Val Thr Gly Gly His Gly Phe Pro Gin Ala Phe 



390 



395 



Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp His His 



405 



410 



400 



Leu 



415 



Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His Ala 



420 



425 



Leu Val 



430 
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Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr. His Glu Ala Asp L eu ■ 



445 



5 



val jsp Gly ttr Met Glu Val Le u His His Leu Gly Ser Val Ala 



460 



Gly 




10 Glu Phe Val Val Asp Phe Val ar« m 

465 "® vaj - Arg Asp Gly Pro Ala Met 

<210> 34 
15 <211> 17061 
<212> DNA 

2eaans Phae0daCtYlUm tricor ™~»< Physcozuitrella patens, Caenorhabditis 

20 <220> 

<221> CDS 

<222> (4554) . . (5987) 



25 



30 



<223> 



<220> 

<221> CDS 

<222> (2805) . . (3653) 
<223> 



<220> 

<221> CDS 

<222> {1026) ..(1898) 
35 <223> 



40 




50 



55 



60 



<400> 34 

tggggaaccc tgtggttggc atgcacatac aaatggacga aggataaacc ttttcacgcc 
cttttaaata tccgattatt ctaataaacg ctcttttctc ttaggtttac ccgccaatat 
atcctgtcaa acactgatag tttaaactga aggcgggaaa cgacaatctg atcatgagcg 
gagaattaag ggagtcacgt tatgaccccc gccgatgacg cgggacaagc cgttttacgt 
ttggaactga cagaaccgca acgttgaagg agccactcag ccgatctgaa ttcatcgatc 
ctctagaggc gcgccgagct cctcgagcaa atttacacat tgccactaaa cgtctaaacc 
cttgtaattt gtttttgttt tactatgtgt gttatgtatt tgatttgcga taaattttta 
tatttggtac taaatttata acacctttta tgctaacgtt tgccaacact tagcaatttg 
caagttgatt aattgattct aaattatttt tgtcttctaa atacatatac taatcaactg 
gaaatgtaaa tatttgctaa tatttctact ataggagaat taaagtgagt gaatatggta 
ccacaaggtt tggagattta attgttgcaa tgctgcatgg atggcatata caccaaacat 
tcaataattc ttgaggataa taatggtacc acacaagatt tgaggtgcat gaacgtcacg 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
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20 



25 



30 



35 



40 



I 



95 

gttta * taat "ttcaagac aacaatgtta ccacacacaa gttttgaggt 
gcatgcatgg atgccctgtg gaaagtttaa aaatattttg gaaatgattt gcatggaagc 
catgtgtaaa accatgacat ocacttggag gatgcaataa tgaagaaaac tacaaattta 
catgcaacta gttatgcatg tagtctatat aatgaggatt ttgcaatact ttcattcata 
cacactcact aagttttaca cgattataat ttcttcatag ccagcccacc gcggtgggcg 

— 2 K S2 Sf = s 2 £ s a s S ~ - e; 

io 15 

£ 2 £ £ E E £ E S E E S S3 S 2 £ 

25 30 

gat acg'ccc act acc aaa crcrc ttcr n<~r* 

Asp Thr Pro Thr *hr LyJ g?J Pro Leu Sf ^ CCC 

35 * ^ Y ^ eu Fro Leu Val Asp Ser Pro Thr Pro 

40 45 

ate gtc etc ggt gtt tct gta tac ttcr act a hh rrt-r, 

He V,! j» o ly v.! Ser Va! w J* £ £ S3 £ £ £ 25 

55 60 

2 s £ E E s s a £ £ E E £ ffi £ £ 

a £ = a £ as £ e e e 2 £ s ~ a « 

90 

£ £ £ £ £ £ £ £ S £ £ S £ £ £ £ 

105 110 

£ £ £ 5 £ £ S £ £ £ £ £ £ ~ £ E 

120 125 

£ £ S £ £ £ £ £ £ £ £ S = z s 

135 14Q 

£ S £ £ £ £ £ £ = - - - - = = 

150 155 

£ £ £ £ £ £ £ £ £ £ - 5 5 E a « 

170 175 

£ £ E £ £ S £ S £ £ £ £ £ £ = S 

185 190 
gga gtg cat gtt etc atg tat geer tat ta<- 

«y v.i Bis « «u «e t ^ £ £ £ £ £j S S £ £ 

200 205 



780 
840 
900 
960 
1020 
1070 

1118 

1166 

1214 

1262 

1310 

1358 

1406 



1454 



1502 



1550 



1598 



1646 
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5 S = S S S a S S S a S S S 5 £ • 1684 

215 220- 



a s a s a a s a s a a a a a a a 1712 



10 s £ s a a a a a a a a a a a a a 1790 

245 250 2 55 



1838 



;2 s ss s ;s ?* T ttg T ctsr fctt ctt ttc ggc «* 

ig eu *ne Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe 

265 270 

£ a s£ s a s a a a a a a a a s a 1886 

280 285 

Ss £ STu ^ tCtagaasgc ctcctBcttt aatgagatat gcgagacgcc 1938 
290 

tatgatcgca tgatatttgc tttcaattct gttgtgcacg ttgtaaaaaa cctgagcatg 1998 

tgtagctcag atccttaccg ccggtttcgg ttcattctaa tgaatatatc acccgttact 2058 

atcgtatttt tatgaataat attctccgtt caatttactg attgtccgtc gagcaaattt 2118 

acacattgcc actaaacgtc taaacccttg taatttgttt ttgttttact atgtgtgtta 2178 

tgtatttgat ttgcgataaa tttttatatt tggtactaaa tttataacac cttttatgct 2238 

aacgtttgcc aacacttagc aatttgcaag ttgattaatt gattctaaat tatttttgtc 2298 

ttctaaatac atatactaat caactggaaa tgtaaatatt tgctaatatt tctactatag 2358 

gagaattaaa gtgagtgaat atggtaccac aaggtttgga gatttaattg ttgcaatgct 2418 

gcatggatgg catatacacc aaacattcaa taattcttga ggataataat ggtaccacac 2478 

aagatttgag gtgcatgaac gtcacgtgga caaaaggttt agtaattttt caagacaaca 2538 

atgttaccac acacaagttt tgaggtgcat gcatggatgc cctgtggaaa gtttaaaaat 2598 

attttggaaa tgatttgcat ggaagccatg tgtaaaacca tgacatccac ttggaggatg 2658 

caataatgaa gaaaactaca aatttacatg caactagtta tgcatgtagt otatataatg 2718 

aggattttgc aatactttoa ttcatacaca ctcactaagt tttacacgat tataatttct 2778 

tcatagccag cggatccgcc cacata atg gag aac ttc tgg tot att gtt gtg 2831 

Met Glu Asn Phe Trp Ser lie Val Val 
295 

i£ £ a 2 a s a s a a m a a a a a 2878 

31 ° 315 
tgc cac tac tat atg egg att tea t-n- *-=„ 

«*. His ». s a a £ a a s a a 2827 
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320 325 33Q 



10 



15 



370 375 



flgt ccg get gta gtt att tgt aat cat cag agt tct etc gac att eta 

So 1 Val 5: <*• *■» His Gln ser ser Le - K Si 2; 

385 390 395 

<5« r Me>f an a T1 m — ' • -' = ~" w al -s acg aaa cga 

Ser Met Ala ser lie Trp Pro Lys Asn Cys Val Val Met Met Ly S Arg 




460 465 470 



475 



aca aaa ggg etc act ctt gat gac gtc age gag ttg tct aat afctr 
Thr Lys Gly Leu Thr L eu Asp Asp Val Ser SlS Su Ser Sp Me? gs 

530 535 

egg gac gtt atg ttg gca gee tat aag gaa gtt act eta aaa crot- ~„ 
Arg asp val Met Leu Ala Ala Tyr LyJ §l u vaj £ Leu SI Sin 

550 555 

caa cga aat gcg aca egg cgt gga gaa aea aaa gac ggg aag aaa tct 
Gin Arg Asn Ala Thr Arg Arg Gly Glu Thr Lys Asp lly Sys Lys Ser 
560 565 570 



2975 



^ 2?* S tg gaa 9tt tsrt er fct aca atCT ate cct tct tgg eta aat aaa 
His Gly Met Glu Val Cys Val Thr Met He Pro Ser tS Leu Sn Sg 
335 340 345 

5 SS E S S 52 2 1 £ S £ £ 5 S £ S 3023 
£ S ?S Si S s ?£ £ S - S £ S cS SS S 3071 



3119 



20 S S E 11* S S S X £ S - gt - - 3ta at9 at3 aaa csa 3157 

400 405 410 

att ctt gee tat gtt cca ttc ttc aat etc gga gee tac ttt tec aac -om 
He Leu Ala Tyr Val Pro Phe Phe Asn Leu Gly Ala Tyr Pne Ser A^n 3215 
415 420 425 



Thr xll lit ril * SSL tat aa ° Cgt gaa C£ft CTCCT ato «ct tea gtt 

Thr He Phe He Asp Arg Tyr Asn Arg Glu Arg Ala Met Ala Ser val 

30 £ ~ ' 435 440 

? at l at I fft gCa tCt CTaa atg aag aac aga aat ctt aaa ctt too ota 
Asp Tyr Cys Ala Ser Glu Met Lys Asn Arg Asn Leu Lys Leu Tr? SS 

450 455 

35 ttt ccg gaa gga aca aga aat cgt gaa gga aaa ttc ahf ~ M „ 

Phe Pro Glu Gly Thr Arg Asn Arg Glu §£ S 52 ££ Pro" £ Lyf ^ 



3263 



3311 



4o £ S s £ 2 S S 52 S IS 12 S E £ S S 3407 

480 485 4 90 

fr fc f ^° tCa gaC tat Cgg gat ttc tac tea aag cca ggc cga tat 
Val val Phe Ser Asp Tyr Arg Asp Phe Tyr Ser Lyf Pro Sly X Tyr 
495 500 5 0 5 

ttc aag aat gat gga gaa gtt gtt att cga gtt ctg aat aca ath 
Phe Lys Asn Asp Gly Glu Val Val He Arg val Leu Sp £a Se So 
) J 515 520 



3455 



3503 



3551 



3599 



3647 
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gag taa gctagcgtta accctgcttt aatgagatat gcgagacgcc tatgatcgca 



3703 



tgatatttgc tttcaattct gttgtgcacg ttgtaaaaaa cctgagcatg tgtagctcag 3763 

atccttaccg ccggtttcgg ttcattctaa tgaatatatc acccgttact atcgtatttt 3823 

tatgaataat attctccgtt caatttactg attgtccgtc gagoaaattt acacattgcc 3883 

actaaacgtc taaacccttg taatttgttt ttgttttact atgtgtgtta tgtatttgat 3943 

ttgcgataaa tttttatatt tggtactaaa tttataacac cttttatgct aacgtttgcc 4003 

aacacttagc aatttgcaag ttgattaatt gattctaaat tatttttgtc ttctaaatac 4063 

atatactaat caactggaaa tgtaaatatt tgctaatatt tctactatag gagaattaaa 4123 

gtgagtgaat atggtaccac aaggtttgga gatttaattg ttgcaatgct gcatggatgg 4183 

catatacacc aaacattcaa taattcttga ggataataat ggtaccacac aagatttgag 4243 

gtgcatgaac gtcacgtgga caaaaggttt agtaattttt caagacaaca atgttaccac 43 03 

acacaagttt tgaggtgcat gcatggatgc cctgtggaaa gtttaaaaat attttggaaa 4363 

tgatttgcat ggaagccatg tgtaaaacca tgacatccac ttggaggatg caataatgaa 4423 

gaaaactaca aatttacatg caactagtta tgcatgtagt ctatataatg aggattttgc 4483 

aatactttca ttcatacaca ctcactaagt tttacacgat tataatttct tcatagccag 4543 

cagatctaaa atg ggc aaa gga ggg gao get egg gec teg aag ggc tea 4592 
Met Gly Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser 
575 580 585 

acg gcg get cgc aag ate agt tgg cag gaa gtc aag ace cac gcg tct 4640 
Thr Ala Ala Arg Lys He Ser Trp Gin Glu Val Lys Thr His 111 Ser 
590 595 goo 

ccg gag gac gee tgg ate att cac tec aat aag gtc tac gac gtg tec 4688 
Pro Glu Asp Ala Trp He He His Ser Asn Lys Val Tyr Asp ? a ? Ser 
605 610 615 

aac tgg cac gaa cat ccc gga ggc gee gtc att ttc acg cac gee get 473 s 

Asn Trp His Glu His Pro Gly Gly Ala Val lie Phe Thr Ss Sa 2£ 
620 625 630 

gac gac atg acg gac att ttc get gee ttt cac gca ccc gga tccr cacr 478/1 
Asp Asp Met Thr Asp He Phe Ala Ala Phe His La Pro Sy se? Sin 
635 640 645 

teg etc atg aag aag ttc tac att ggc gaa ttg etc ccg gaa acc ace 4832 
Ser Leu Met Lys Lys Phe Tyr He Gly Glu Leu Leu Pr? Glu Thr Thr 
650 655 660 665 

ggc aag gag ccg cag caa ate gee ttt gaa aag ggc tac cgc gat eta 4880 
Gly Lys Glu Pro Gin Gin He Ala Phe Glu Lys Sly Tyr Arg Asp llu 
670 675 680 

cgc tee aaa etc ate atg atg ggc atg ttc aag tec aac aag tgg ttc 4928 
Arg Ser Lys Leu He Met Met Gly Met Phe LyI Ser Asn Lys Tr? Phe 
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Leu E S £ 25 -?* CS9 tCt taC * aa ctc gee 

Leu Ala Trp Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin La 

815 820 825 

gac gga aag gat teg ggt ttg gtc aag ttc atg ate cat aac c aa 
Asp Gly Lys Asp Ser Gly Leu Val Lys Pne Me? xle Arg Asn Sin Ser 
830 835 840 

£ £ £ £ E £ £ £ EE £ £ £ £ - £ 

850 355 

2 £ £ £ £ S £ E « oTy £ E £ E £ E 

• 865 870 

E £ 2 £ £ E £ SS £ E £ E £ £ E £ 55M 
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895 900 905 

ttt gga cgc ttc teg ttc gcg tac ace oca ttt- t,r 
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%i C 5*? taC aat gCC gac gcc c ^ t CC S gac ttc tgg aag 

Y o!n Ala Thr ^ Asn Ala As *> Ala A ^ Asp Phe Trp Lys 

• 9 40 945 950 

etc caa gtc acc acg act cgc aac gtc acg ggc gga cac ggt ttc ccc 
Leu Gin Val Thr Thr Thr Arg Asn Val Thr Gly 2 y His lly pK P?o 
955 960 965 

^ ?? C 2* S 1 ? ^ tgg ttC tgt ggt ggc ctc ca * tac caa gtc gac 
Gin Ala Phe Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp 

970 975 980 . " 985 

S?! uf! r ta ^° CCC agC ° tg CCC cga cac aat ct S ^cc aa ^ aca cac 
His Hxs Leu Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His 

990 995 1000 

gca ctg gtc gaa teg ttc tgc aag gag tgg ggt gtc cag tac cac 
Ala Leu Val Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr His 
1005 1010 1015 

gaa gcc gac ctt gtg gac ggg acc atg gaa gtc ttg cac cat ttg 
Glu Ala Asp Leu Val Asp Gly Thr Met Glu Val Leu His His Leu 
1020 1025 1030 

ggc age gtg gcc ggc gaa ttc gtc gtg gat ttt gta cgc gat gga 
Gly Ser Val Ala Gly Glu Phe Val Val Asp Phe Val Arg Asp Gly 

1040 1045 

ccc gcc atg taa agatctgecg gcatcgatcc cgggccatgg cctgctttaa 
Pro Ala Met 



5696 



5744 



5792 



5840 



5885 



5930 



5975 



6027 



tgagatatgc 
gtaaaaaacc 
aatatatcac 
tgtcegtega 
aagcactcag 
aaacggtgct 
agegcaaaga 
gttttatgga 
aagccctgca 
tcaagatcat 
caagccgttt 
ggtttctgga 
gtcgcctaag 
ccataaattc 
ctctagtcga 



gagacgecta 
tgagcatgtg 
ccgttactat 
cgagctcggc 
ggcgcaaggg 
gaccccggat 
gaaagcaggt 
cagcaagega 
aagtaaactg 
gageggagaa 
tacgtttgga 
gtttaatgag 
gtcactatca 
ccctcggtat 
gggcccatgg 



tgatcgcatg 

tagctcagat 

cgtattttta 

gcgccgtcga 

ctgetaaagg 

gaatgtcagc 

agettgeagt 

aceggaattg 

gatggctttc 

ttaagggagt 

actgacagaa 

ctaagcacat 

gctagcaaat 

ccaattagag 

gagcttggat 



atatttgett 

ccttaccgcc 

tgaataatat 

cctgcaggca 

aageggaaca 

tactgggcta 

gggcttacat 

ccagctgggg 

ttgccgccaa 

cacgttatga 

ccgcaacgtt 

aegtcagaaa 

atttcttgtc 

tctcatattc 

tgaacaagat 



tcaattctgt 

ggtttcggtt 

tctccgttca 

tgeaagctte 

egtagaaage 

tctggacaag 

ggegataget 

cgccctctgg 

ggatctgatg 

cccccgccga 

gaaggageca 

ecattattge 

aaaaatgetc 

actctcaatc 

ggattgcacg 



tgtgcacgtt 

cattctaatg 

atttactgat 

acgctgccgc 

cagtccgcag 

ggaaaacgea 

agactgggcg 

taaggttggg 

gcgcagggga 

tgacgcggga 

ctcagccgcg 

gcgttcaaaa 

cactgaegtt 

cagatctcga 

caggttctcc 



6087 

6147 

6507 

6267 

6327 

6387 

6447 

6507 

6567 

6627 

6687 

6747 

6807 

6867 

6927 
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ggccgcttgg 
tgatgccgcc 
cctgtccggt 
gacgggcgtt 
gctattgggc 
agtatccatc 
attcgaccac 
tgtcgatcag 
caggctcaag 
cttgccgaat 
gggtgtggcg 
tggcggcgaa 
gcgcatcgcc 
gacggatccc 
cgcactcagt 
tctgaattta 
gttattttat 
ccgtcgtttt 
cagcacatcc 
cccaacagtt 
gccacgttcg 
tttagtgctt 
gggccatcgc 
agtggactct 
ttataaggga 
aaaccagcgt 
tgttgcccgt 
gtgttattaa 
agccaacagc 
tcagtccggg 
ccgatgctat 



gtggagaggc 
gtgttccggc 
gccctgaatg 
ccttgcgcag 
gaagtgccgg 
atggctgatg 
caagcgaaac 
gatgatctgg 
gcgcgcatgc 
atcatggtgg 
gaccgctatc 
tgggctgacc 
ttctatcgcc 
ccgatgagct 
ctttcatcta 
aacttgcatc 
caataaatat 
acaacgtcgt 
ccctttcgcc 
gcgcagcctg 
ccggctttcc 
tacggcacct 
cctgatagac 
tgttccaaac 
ttttgccgat 
ggaccgcttg 
ctcactggtg 
gttgtctaag 
tccccgaccg 
acggcgtcag 
tcggaagaac 



tattcggcta 
tgtcagcgca 
aactgcagga 
ctgtgctcga 
ggcaggatct 
caatgcggcg 
atcgcatcga 
acgaagagca 
ccgacggcga 
aaaatggccg 
aggacatagc 
gcttcctcgt 
ttcttgacga 
aagctagcta 
cggcaatgta 
aataaattta 
ttaaactata 
gactgggaaa 
agctggcgta 
aatggcgccc 
ccgtcaagct 
cgaccccaaa 
ggtttttcgc 
tggaacaaca 
ttcggaacca 
ctgcaactct 
aaaagaaaaa 
cgtcaatttg 
gcagctcggc 
cgggagagcc 
ggcaactaag 
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tgactgggca 

ggggcgcccg 
cgaggcagcg 
cgttgtcact 
cctgtcatct 
gctgcatacg 
gcgagcacgt 
tcaggggctc 
ggatctcgtc 
cttttctgga 
gttggctacc 
gctttacggt 
gttcttctga 
tatcatcaat 
ccagctgata 
tgtttttgct 
tttctttcaa 
accctggcgt 
atagcgaaga 
gctcctttcg 
ctaaatcggg 
aaacttgatt 
cctttgacgt 
ctcaacccta 
ccatcaaaca 
ctcagggcca 
ccaccccagt 
tttacaccac 
acaaaatcac 
gttgtaaggc 
ctgccgggtt 



caacagacaa 
gttctttttg 
cggctatcgt 
gaagcgggaa 
caccttgctc 
cttgatccgg 
actcggatgg 
gcgccagccg 
gtgacccatg 
ttcatcgact 
cgtgatattg 
atcgccgctc 
gcgggaccca 
ttatgtatta 
taatcagtta 
tggactataa 
gatgggaatt 
tacccaactt 
ggcccgcacc 
ctttcttccc 
ggctcccttt 
tgggtgatgg 
tggagtccac 
tctcgggcta 
ggattttcgc 
ggcggtgaag 
acattaaaaa 
aatatatcct 
cactcgatac 
ggcagacttt 
tgaaacacgg 



tcggctgctc 
tcaagaccga 
ggctggccac 
gggactggct 
ctgccgagaa 
ctacctgccc 
aagccggtct 
aactgttcgc 
gcgatgcctg 
gtggccggct 
ctgaagagct 
ccgattcgca 
agctagcttc 
cacataatat 
ttgaaatatt 
tacctgactt 
aattcactgg 
aatcgccttg 
gatcgccctt 
ttcctttctc 
agggttccga 
ttcacgtagt 
gttctttaat 
ttcttttgat 
ctgctggggc 
ggcaatcagc 
cgtccgcaat 
gccaccagcc 
aggcagccca 
gctcatgtta 
atgatctcgc 



6987 
7047 
7107 
7167 
7227 
7287 
7347 
7407 
7467 
7527 
7587 
7647 
7707 
7767 
7827 
7887 
7947 
8007 
8067 
.8127 
8187 
8247 
8307 
8367 
8427 
8487 
8547 
8607 
8667 
8727 
8787 
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ggagggtagc atgttgattg taacgatgac agagcgttgc tgcctgtgat caaatatcat 8847 
ctccctcgca gagatccgaa ttatcagcct tcttattcat ttctcgctta accgtgacag 8907 
gctgtcgatc ttgagaacta tgccgacata ataggaaatc gctggataaa gccgctgagg 8967 
aagctgagtg gcgctatttc tttagaagtg aacgttgacg atatcaactc ccctatccat 9027 
tgctcaccga atggtacagg tcggggaccc gaagttccga ctgtcggcct gatgcatccc 9087 
cggctgatcg accccagatc tggggctgag aaagcccagt aaggaaacaa ctgtaggttc 9147 
gagtcgcgag atcccccgga accaaaggaa gtaggttaaa cccgctccga tcaggccgag 9207 
ccacgccagg ccgagaacat tggttcctgt aggcatcggg attggcggat caaacactaa 9267 
agctactgga acgagcagaa gtcctccggc cgccagttgc caggcggtaa aggtgagcag 9327 
aggcacggga ggttgccact tgcgggtcag cacggttccg aacgccatgg aaaccgcccc 9387 
cgccaggccc gctgcgacgc cgacaggatc tagcgctgcg tttggtgtca acaccaacag 9447 
cgccacgccc gcagttccgc aaatagcccc caggaccgcc atcaatcgta tcgggctacc 9507 
tagcagagcg gcagagatga acacgaccat cagcggctgc acagcgccta ccgtcgccgc 9567 
gaccccgccc ggcaggcggt agaccgaaat aaacaacaag ctccagaata gcgaaatatt 9627 
aagtgcgccg aggatgaaga tgcgcatcca ccagattccc gttggaatct gtcggacgat 9687 
catcacgagc aataaacccg ccggcaacgc ccgcagcagc ataccggcga cccctcggcc 9747 
tcgctgttcg ggctccacga aaacgccgga cagatgcgcc ttgtgagcgt ccttggggcc 9807 
gtcctcctgt ttgaagaccg acagcccaat gatctcgccg tcgatgtagg cgccgaatgc 9867 
cacggcatct cgcaaccgtt cagcgaacgc ctccatgggc tttttctcct cgtgctcgta 9927 
aacggacccg aacatctctg gagctttctt cagggccgac aatcggatct cgcggaaatc 9987 
ctgcacgtcg gccgctccaa gccgtcgaat ctgagcctta atcacaattg tcaattttaa 10047 
tcctctgttt atcggcagtt cgtagagcgc gccgtgogtc ccgagcgata ctgagcgaag 10107 
caagtgcgtc gagcagtgcc cgcttgttcc tgaaatgcca gtaaagcgct ggctgctgaa 10167 
cccccagccg gaactgaccc cacaaggccc tagcgtttgc aatgcaccag gtcatcattg 10227 
acccaggcgt gttccaccag gccgctgcct cgcaactctt cgcaggcttc gccgacctgc 10287 
tcgcgccact tcttcacgcg ggtggaatcc gatccgcaca tgaggcggaa ggtttccagc 10347 
ttgagcgggt acggctcccg gtgcgagctg aaatagtcga acatccgtcg ggccgtcggc 10407 
gacagcttgc ggtacttctc ccatatgaat ttcgtgtagt ggtcgccagc aaacagcacg 10467 
acgatttcct cgtcgatcag gacctggcaa cgggacgttt tcttgccacg gtccaggacg 10527 
cggaagcggt gcagcagcga caccgattcc aggtgcccaa cgcggtcgga cgtgaagccc 10587 
atcgccgtcg cctgtaggcg cgacaggcat tcctcggcct tcgtgtaata ccggccattg 10647 
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atcgaccagc ccaggtcctg gcaaagctcg tagaacgtga aggtgatcgg ctcgccgata 10707 
ggggtgcgct tcgcgtactc caacacctgc tgccacacca gttcgtcatc gtcggcccgc 10767 
agctcgacgc cggtgtaggt gatcttcacg tccttgttga cgtggaaaat gaccttgttt 10827 
tgcagcgcct cgcgcgggat tttcttgttg cgcgtggtga acagggcaga gcgggccgtg 10887 
tcgtttggca tcgctcgcat cgtgtccggc cacggcgcaa tatcgaacaa ggaaagctgc 10947 
atttccttga tctgctgctt cgtgtgtttc agcaacgcgg ccitgcttggc ctcgctgacc 11007 
tgttttgcca ggtcctogcc ggcggttttt cgcttcttgg tcgtcatagt tcctcgcgtg 11067 
tcgatggtca tcgacttcgc caaacctgcc gcctcctgtt cgagacgacg cgaacgctcc 11127 
acggcggccg atggcgcggg cagggcaggg ggagccagtt gcacgctgtc gcgctcgatc 11187 
ttggccgtag cttgctggac catcgagccg acggactgga aggtttcgcg gggcgcacgc 11247 
atgacggtgc ggcttgcgat ggtttcggca tcctcggcgg aaaaccccgc gtcgatcagt 11307 
tcttgcctgt atgccttccg gtcaaacgtc cgattcattc accctccttg cgggattgcc 11367 
ccgactcacg ccggggcaat gtgcccttat tcctgatttg acccgcctgg tgccttggtg 11427 
tccagataat ccaccttatc ggcaatgaag tcggtcccgt agaccgtctg gccgtccttc 11487 
tcgtacttgg tattccgaat cttgccctgc acgaatacca gcgacccctt gcccaaatac 11547 
ttgccgtggg cctcggcctg agagccaaaa cacttgatgc ggaagaagtc ggtgcgctcc 11607 
tgcttgtcgc cggcatcgtt gcgccacatc taggtactaa aacaattcat ccagtaaaat 11667 
ataatatttt attttctccc aatcaggctt gatccccagt aagtcaaaaa atagctcgac 11727 
atactgttct tccccgatat cctccctgat cgaccggacg cagaaggcaa tgtcatacca 11787 
cttgtccgcc ctgccgcttc tcccaagatc aataaagcca cttactttgc catctttcac 11847 
aaagatgttg ctgtctccca ggtcgccgtg ggaaaagaca agttcctctt cgggcttttc 11907 
cgtct'ttaaa aaatcataca gctcgcgcgg atctttaaat ggagtgtctt cttcccagtt 11967 
ttcgcaatcc acatcggcca gatcgttatt cagtaagtaa tccaattcgg ctaagcggct 12027 
gtctaagcta ttcgtatagg gacaatccga tatgtcgatg gagtgaaaga gcctgatgca 12087 
ctccgcatac agctcgataa tcttttcagg gctttgttca tcttcatact cttccgagca 12147 
aaggacgcca tcggcctcac tcatgagcag attgctccag ccatcatgcc gttcaaagtg 12207 
caggaccttt ggaacaggca gctttccttc cagccatagc atcatgtcct tttcccgttc 12267 
cacatcatag gtggtccctt tataccggct gtccgtcatt tttaaatata ggttttcatt 12327 ' 
ttctcccacc agcttatata ccttagcagg agacattcct tccgtatctt ttacgcagcg 12387 
gtatttttcg atcagttttt tcaattccgg tgatattctc attttagcca tttattattt 12447 
ccttcctctt ttctacagta tttaaagata ccccaagaag ctaattataa caagacgaac 12507 
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tccaattcac tgttccttgc attctaaaac cttaaatacc agaaaacagc tttttcaaag 125 S7 
ttgttttcaa agttggcgta taacatagta tcgacggagc cgattttgaa accacaatta 12627 
tgggtgatgc tgccaactta ctgatttagt gtatgatggt gtttttgagg tgctccagtg 12687 
gcttctgtgt ctatcagctg tccctcctgt tcagctactg acggggtggt gcgtaacggc 12747 
aaaagcaocg ccggacatca gcgctatctc tgctctcact gccgtaaaac atggcaactg 12807 
cagttcactt acaccgcttc tcaacccggt acgcaccaga aaatcattga tatggccatg 12867 
aatggcgttg gatgccgggc aacagcccgc attatgggcg ttggcctcaa cacgatttta 12927 
cgtoacttaa aaaactcagg ccgcagtcgg taacctcgcg catacagccg ggcagtgacg 12987 
tcatcgtctg cgcggaaatg gacgaacagt ggggctatgt cggggctaaa tcgcgccagc 13047 
gctggctgtt ttacgcgtat gacagtctcc ggaagacggt tgttgcgcac gtattcggtg 13107 
aacgoactat ggcgacgctg gggcgtctta tgagcctgct gtcacccttt gacgtggtga 13167 
tatggatgac ggatggctgg ccgctgtatg aatcccgcct gaagggaaag ctgcacgtaa 13227 
tcagcaagcg atatacgcag cgaattgagc ggcataacct gaatctgagg cagcacctgg 13287 
cacggctggg acggaagtcg ctgtcgttct caaaatcggt ggagctgcat gacaaagtca 13347 
tcgggcatta tctgaacata aaacactatc aataagttgg agtcattacc oaattatgat 13407 
agaatttaca agctataagg ttattgtcct gggtttcaag cattagtcca tgcaagtttt 13467 
tatgctttgc ccattctata gatatattga taagcgcgct gcctatgcct tgccccctga 13527 
aatccttaca tacggcgata tcttctatat aaaagatata ttatcttatc agtattgtca 13587 
atatattcaa ggcaatctgc ctcctcatcc tcttcatcct cttcgtcttg gtagcttttt 13647 
aaatatggcg cttcatagag taattctgta aaggtccaat tctcgttttc atacctcggt 13707 
ataatcttac ctatcacctc aaatggttcg ctgggtttat cgcacccccg aacacgagca 13767 
cggcacccgc gaccactatg ccaagaatgc ccaaggtaaa aattgccggc cccgccatga 13827 
agtccgtgaa tgccccgacg gccgaagtga agggcaggcc gccacccagg ccgccgccct 13887 
cactgcccgg cacctggtcg ctgaatgtcg atgccagcac ctgcggcacg tcaatgcttc 13947 
cgggcgtcgc gctcgggctg atcgcccatc ccgttactgc cccgatcccg gcaatggcaa 14007 
ggactgccag cgctgccatt tttggggtga ggccgttcgc ggccgagggg cgcagcccct 14067 
ggggggatgg gaggcccgcg ttagcgggcc gggagggttc gagaaggggg ggcacccccc 14127 
ttcggcgtgc gcggtcacgc gcacagggcg cagccctggt taaaaacaag gtttataaat 14187 
attggtttaa aagcaggtta aaagacaggt tagcggtggc cgaaaaacgg gcggaaaccc 14247 
ttgcaaatgc tggattttct gcctgtggac agcccctcaa atgtcaatag gtgcgcccct 14307 
catctgtcag cactctgccc ctcaagtgtc aaggatcgcg cccctcatct gtcagtagtc 14367 
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gcgcccctca agtgtcaata ocgcagggca cttatcccca ggcttgtcca catcatctgt 14427 
gggaaactcg cgtaaaatca ggcgttttcg ccgatttgcg aggctggcca gctccacgtc 14487 
gccggccgaa atcgagcctg cccctcatct gtcaacgccg cgccgggtga gtcggcccct 14547 
caagtgtcaa cgtccgcccc tcatctgtca gtgagggcca agttttccgc gaggtatcca 14607 
caacgccggc ggccgcggtg tctcgcacac ggcttcgacg gcgtttctgg cgcgtttgca 14667 
gggccataga cggccgccag cccagcggcg agggcaacca gcccggtgag cgtcgcaaag 14727 
gcgctcggtc ttgccttgct cgtcggtgat gtacttcacc agctccgcga agtcgctctt 14787 
cttgatggag cgcatgggga cgtgcttggc aatcacgcgc accccccggc cgttttagcg 14847 
gctaaaaaag tcatggctct gccctcgggc ggaccacgcc catcatgacc ttgccaagct 14907 
cgtcctgctt ctcttcgatc ttcgccagca gggcgaggat cgtggcatca ccgaaccgcg 14967 
ccgtgcgcgg gtcgtcggtg agccagagtt tcagcaggcc gcccaggcgg cccaggtcgc 15027 
cattgatgcg ggccagctcg cggacgtgct catagtccac gacgcccgtg attttgtagc 15087 
cctggccgac ggccagcagg taggccgaca ggctcatgcc ggccgccgcc gccttttcct 15147 
caatcgctct tcgttcgtct ggaaggcagt acaccttgat aggtgggctg cccttcctgg 15207 
ttggcttggt ttcatcagcc atccgcttgc cctcatctgt tacgccggcg gtagccggcc 15267 
agcctcgcag agcaggattc ccgttgagca ccgccaggtg cgaataaggg acagtgaaga 15327 
aggaacaccc gctcgcgggt gggcctactt cacctatcct gcccggctga cgccgttgga 15387" 
tacaccaagg aaagtctaca cgaacccttt ggcaaaatcc tgtatatcgt gcgaaaaagg 15447 
atggatatac cgaaaaaatc gctataatga ccccgaagca gggttatgca gcggaaaagc 15507 
gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 15567 
ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 15627 
tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 15687 
tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 15747 
cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag 15807 
tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa 15867 
gcggaagagc gccagaaggc cgccagagag gccgagcgcg gccgtgaggc ttggacgcta 15927 
gggcagggca tgaaaaagcc cgtagcgggc tgctacgggc gtctgacgcg gtggaaaggg . 15987 
ggaggggatg ttgtctacat ggctctgctg tagtgagtgg gttgcgctcc ggcagcggtc 16047 
ctgatcaatc gtcacccttt ctcggtcctt caacgttcct gacaacgagc ctccttttcg 16107 
ccaatccatc gacaatcacc gcgagtccct gctcgaacgc tgcgtccgga ccggcttcgt 16167 
cgaaggcgtc tatcgcggcc cgcaacagcg gcgagagcgg agcctgttca acggtgccgc 16227 



10 



15 
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cgcgctcgcc ggeatcgctg tcgccggcct gctcctcaag cacggcccca acagtgaagt 16287 

agctgattgt catcagcgca ttgacggcgt ccccggccga aaaacccgcc tcgcagagga 16347 

agcgaagctg cgcgtcggcc gtttccatct gcggtgcgcc cggtcgcgtg ccggcatgga 16407 

tgcgcgcgcc atcgcggtag gcgagcagcg cctgcctgaa gotgcgggca ttcccgatca 16467 

gaaatgagcg ccagtcgtcg tcggctctcg gcaccgaatg cgtatgattc tccgccagca 16527 

tggcttcggc cagtgcgtcg agcagcgccc gcttgttcct gaagtgccag taaagcgccg 16587 

gctgctgaac ccccaaccgt tccgccagtt tgcgtgtcgt cagaccgtct acgccgacct 16647 

ogttcaacag gtccagggcg gcacggatca ctgtattcgg ctgcaacttt gtcatgcttg 16707 

acactttatc actgataaac ataatatgtc caccaactta teagtgataa agaatccgcg 16767 

cgttcaatcg gaccagcgga ggctggtccg gaggccagac gtgaaaccca acatacocct 16827 

gatcgtaatt ctgagcactg tcgcgctcga cgctgtcggc atcggcctga ttatgocggt 16887 

gctgccgggc ctcctgcgcg atctggttca ctcgaacgac gtcaccgccc actatggcat 16947 

tctgctggcg ctgtatgcgt tggtgcaatt tgcctgcgca cctgtgctgg gcgcgctgtc 17007 

ggatcgtttc gggcggcggc caatcttgct cgtctcgotg gccggcgcca gate 17061 

<210> 35 
<211> 290 
<212> PRT 

Segans Phae0daCtylUm tric ° r " U ^' ^co^trella patens, Caenorhabditis 
<400> 35 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
3 10 



15 



Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 25 30 

Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro He 
35 40 45 

Val Leu Gly Val Ser Val Tyr Leu Thr He Val He Gly Gly Leu Leu 

Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 

70 75 80 

Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 
85 90 95 

Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala lie Thr Trp Arg Tyr 
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100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 
° 115 120 125 

Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
1Q 130 135 140 



Val He Met He Leu Lys Arg Ser Thr Arg Gin He Ser Phe Leu His 

15 



145 150 155 160 




val Tyr His His Ser Ser He Ser Leu He Trp Trp Ala He Ala His 
165 170 175 

20 His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 185 190 

■or Val His Leu Met Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 

^° 195 200 205 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
30 210 215 220 - 

Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 



35 



Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lys He 
245 250 " 255 




40 Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
260 265 270 

SIR Gln !££ Ile Lys Pro Ser A SP Gly Lys Gin Lys Gly Ala Lys 

275 280 285 

Thr Glu 
290 

50 

<210> 36 
<211> 282 
<212> PRT 

55 elegans Pllae0daCtylUm tricornutum ' Kiyscomitrella patens, Caenorhabditis 
<400> 36 

60 Met Glu Asn Phe Trp Ser He Val Val Phe Phe Leu Leu Ser He Leu 
1 5 10 is 
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Phe lie Leu Tyr Asn lie Ser Thr val Cys His Tyr Tyr Met Arg He 
20 25 30 

Ser Phe Tyr Tyr Phe Thr He Leu Leu His Gly Met Glu Val Cys Val 
35 40 45 

Thr Met He Pro Ser Trp Leu Asn Gly Lys Gly Ala Asp Tyr Val Phe 
50 55 eo 

His Ser Phe Phe Tyr Trp Cys Lys Trp Thr Gly Val His Thr Thr Val 
65 70 75 80 

Tyr Gly Tyr Glu Lys Thr Gin Val Glu Gly Pro Ala Val Val He Cys 
85 90 95 

Asn His Gin Ser Ser Leu Asp He Leu Ser Met Ala Ser He Trp Pro 
100 105 no 

Lys Asn Cys Val Val Met Met Lys Arg He Leu Ala Tyr Val Pro Phe 
115 120 125 

Phe Asn Leu Gly Ala Tyr Phe Ser Asn Thr He Phe He Asp Arg Tyr 
130 135 140 

Asn Arg Glu Arg Ala Met Ala Ser Val Asp Tyr Cys Ala Ser Glu Met 
145 150 155 iso 

Lys Asn Arg Asn Leu Lys Leu Trp Val Phe Pro Glu Gly Thr Arg Asn 
165 170 175 

Arg Glu Gly Gly Phe He Pro Phe Lys Lys Gly Ala Phe Asn He Ala 
180 i 8 5 lgo 

Val Arg Ala Gin He Pro He He Pro Val Val Phe Ser Asp Tyr Arg 
i95 200 205 

Asp Phe Tyr Ser Lys Pro Gly Arg Tyr Phe Lys Asn Asp Gly Glu Val 
210 215 220 

Val He Arg Val Leu Asp Ala He Pro Thr Lys Gly Leu Thr Leu Asp 
225 230 235 240 

Asp Val Ser Glu Leu Ser Asp Met Cys Arg Asp Val Met Leu Ala Ala 
245 250 255 

Tyr Lys Glu Val Thr Leu Glu Ala Gin Gin Arg Asn Ala Thr Arg Arg 
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260 265 270 



Gly Glu Thr Lys Asp Gly Lys Lys Ser Glu 
5 275 280 



<210> 37 
<211> 477 
10 <212> PRT 



2"L fi Phae0daCtylUni tricornutu *< Physcomitrella patens, Caenorhabditis 

15 



elegans 
<400> 37 




Met Gly Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser Thr Ala Ala 
1 5 10 15 

20 Arg Lys He Ser Trp Gin Glu Val Lys Thr His Ala Ser Pro Glu Asp 
20 25 30 

Ala Trp lie He His Ser Asn Lys Val Tyr Asp Val Ser Asn Trp His 
^° 35 40 45 

Glu His Pro Gly Gly Ala Val He Phe Thr His Ala Gly Asp Asp Met 
30 55 60 



Thr Asp He Phe Ala Ala Phe His Ala Pro Gly Ser Gin Ser Leu Met 

35 



65 70 75 80 




Lys Lys Phe Tyr He Gly Glu Leu Leu Pro Glu Thr Thr Gly Lys Glu 
85 90 95 

40 Pro Gin Gin He Ala Phe Glu Lys Gly Tyr Arg Asp Leu Arg Ser Lys 

100 105 " 110 

Leu He Met Met Gly Met Phe Lys Ser Asn Lys Trp Phe Tyr Val Tyr 
~ r 115 120 125 

Lys Cys Leu Ser Asn Met Ala He Trp Ala Ala Ala Cys Ala Leu Val 
50 135 140 



Phe Tyr Ser Asp Arg phe Trp Val His Leu Ala Ser Ala Val Met Leu 

55 



145 "0 155 iso 



Gly Thr Phe Phe Gin Gin Ser Gly Trp Leu Ala His Asp Phe Leu His 
165 170 175 

60 His Gin Val Phe Thr Lys Arg Lys His Gly Asp Leu Gly Gly Leu Phe 
180 185 19Q 
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Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp Lys Asn Lys 



200 



205 



His Asn Gly His His Ala Val Pro Asn Leu His Cys Ser Ser Ala Val 



215 



220 



10 Ala Gin Asp Gly Asp Pro Asp He Asp Thr Met Pro Leu Leu Ala Trp 

ZZD 230 — — 



235 



240 



^ Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin Ala Asp Gly 



250 



255 



Lys 



Asp Ser Gly Leu Val Lys Phe Met He Arg Asn Gin Ser Tyr Phe Tyr 

£ D 0 o r- r- 



20 



265 



270 




25 



Phe Pro lie Leu Leu Leu Ala Arg Leu Ser Trp Leu Asn Glu Ser Phe 
275 280 285 

Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Ala Leu Glu 
290 295 300 



30 Leu Lys Ala Lys Gly 



Leu Gln Tyr Pro Leu Leu Glu Lys Ala Gly He 
305 310 315 320 



35 



Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser Ser Gly Phe Gly Arg 

325 *** '**' 



330 



335 



Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu Thr Ala Thr Ala 



40 



340 



345 



Ser 



350 




Cys Gly Phe Leu Leu Ala He Val Phe Gly Leu Gly His Asn Gly Met 
355 3 6 o 365 

Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe Trp Lys Leu Gin Val 
370 375 380 



50 Thr Thr Thr Arg Asn Val Thr Gly Gly His Gly Phe 



ooc - — -r — Pro Gin Ala Phe 

385 390 ' 395 400 



55 



Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp His His Leu 



405 



410 



415 



Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His Ala Leu Val 
420 425 43 0 

Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr His Glu Ala Asp Leu 
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435 440 445 

Val Asp Gly Thr Met Glu Val Leu His His Leu Gly ser Val Ala Gly 
° 450 455 460 

Glu Phe Val val Asp Ph e Val Arg Asp Gly Pro Ala Met 
10 465 4 ™ 475- 
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Figur 1: Aminosaure-Sequenzvergleich von C. elegans LPLATs (Ce-T06E8.1 und Ce- 
F59F4.4) mit der M musculus LPAAT (Mm-NP061350). 
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CSSSAK 
ISTVCH 
QLPVIG 




51 



PVCAVRGRNV ENMKIpRLLL IiHAKYU 
VTMIPSWLNG KGADY^FHSF FYWCKT 
IiASIPFGKSP nnhfrSfkif qamtw: 




50 

iFIiAILAI 

:gmevc 

GGFLGG 
100 



GAHHFP PT< 
GYEKTQ VE< 
SEILH d; 




201 




FTSP@RC 
FKND 
LTS.BNC 




250 

PP$?S£pEGL TPKdVPaHaD 
JpgSKGL TLgDVSHlsD 
E§D^S . . KF(gSIDEaSA 

285 



pSTDGLGG GDCDKKPGGA GEARL 
ILAAY KEOTLEAQQR NATRRGETKD GKKSE 
JQAHR EKpDAEAAWL NI 
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Figur 2: Fettsaureprofile von transgenen C13ABYS86 S. cerevisiae-Zellen 
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Figur 3: Fettsaureprofile von transgenen C13ABYS86 S. cerevisiae-Zellen 





Retentionszeit 



BASF Plant Science GmbH 



20030015 



PF 54305 DE 



Figur 4: Elongation exogen applizierter 1 8:2 49,12 bzw. 18:3 A9,12,15 im Anschluss 
ihre endogene A-6-Desaturierung (Daten aus Fig. 2 und 3). 
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Figur 5: Fettsaure-Profile von transgenen INVSd S. cerev/s/ae-Zellen 
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Figur 6: Fettsaure-Profile von transgenen INVSd S. cerevfe/ae-Zellen. 
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Figur 7: Acyl-CoA-Zusammensetzung transgener INVSd Hefen, die mit den Vek- 
toren pESCLeu PpD6Pse1/pYes2 (A) Oder pESCLeu-PpD6-Pse1/pYes2- 
T06E8.1 (B) transformiert worden waren. 
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Figur 8: Vektorkarte von pSUN3CeLPLAT 
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Figur 9A: Vektorkarte von pGPTV LeB4-700 + T06E8. 1 
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Figur 9B: Vektorkarte von pGPTV USP/OCS-1 ,2,3 PSE1 (Pp)+D6-Des(Pt)+2AT 
(T06E8-1) 



pGPTV/USP/OCS-1,2,3 PSE1(Pp) D6-Des(Pt)-2 AT(T06E8-1) 
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Figur 10A: Biosynthese-Weg von LCPUFAs 
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Figur 10B: Biosynthese-Weg von LCPUFAs 
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